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内 容 简 介 


人 工 智能 是 研究 理解 和 模拟 人 类 智能 、 智 能 行为 及 其 规律 的 一 门 学 科 , 其 主要 任务 是 建立 智能 信息 
处 理 理论 ,进而 设计 可 以 展现 某 些 近 似 于 人 类 智能 行为 的 计算 系统 。 本 书 介绍 人 工 智能 的 理论 、 方 法 和 
技术 及 其 应 用 ,除了 讨论 那些 仍然 有 用 的 和 有 效 的 基本 原理 和 方法 之 外 ,着 重 阐述 一 些 新 的 和 正在 研究 
的 人 工 智能 方法 与 技术 ,特别 是 近期 发 展 起 来 的 方法 和 技术 。 此 外 ,用 比较 多 的 篇 幅 论述 人 工 智 能 的 应 
用 ,包括 新 的 应 用 研究 。 

本 书包 括 下 列 内 容 : 简 述 人 工 智能 的 起 源 与 发 展 ,讨论 人 工 智能 的 定义 、 人 工 智能 与 计算 机 的 关 
系 以 及 人 工 智 能 的 研究 和 应 用 领域 ; @ 论 述 知识 表示 ,推理 和 不 确定 推理 的 主要 方法 ,包括 谓词 逻辑 、 
产生 式 系统 ,语义 网 络 、 框 架 、 知 识 图 谱 、 归 结 推理 、 非 单调 推理 ,主观 Bayes 方法 、 确 定性 理论 .证 据 理 
论 ,模糊 逻辑 和 模糊 推理 等 ; @ 讨 论 常 用 搜索 原理 ,如 盲目 搜索 .启发 式 搜索 .min-max 搜索 、a-B 前 枝 和 
约束 满足 等 ,并 研究 一 些 比 较 高 级 的 搜索 技术 ,如 贪 禁 局 部 搜索 、 局 部 剪 枝 搜索 .模拟 退火 算法 、 遗 传 算 
法 等 ; @ 介 绍 分 布 式 人 工 智能 与 Agent、 计 算 智能 、 反 向 传播 神经 网 络 .深度 学 习 、 竞 争 网 络 支持 向 量化 
等 已 成 为 当前 研究 热点 的 人 工 智 能 技术 和 方法 ; @ 比 较 详 细 地 分 析 人 工 智 能 的 主要 应 用 领域 ,涉及 自 
动 规划 系统 .自然 语言 处 理 、 信 息 检 索 .语言 翻译 .语音 识别 .计算 机 视觉 .群体 智能 机 器 人 等 。 
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BEF SS EEA GE 


在 当今 社会 , 尤其 是 融合 了 社交 内 容 的 移动 互联 网 的 普及 , 如 何 更 好 地 
连接 人 与 信息 , 已 成 为 人 类 社会 的 一 个 重要 基础 命题 。 个 性 化 的 信息 流 已 
经 成 为 一 种 新 的 连接 方式 , 人 与 信息 、 万 物 互 联 。 那 么 , 在 信息 流产 品 平台 
与 服务 这 个 领域 , 如 何 高 效 地 处 理 、 分 析 、 挖 掘 、 理 解 和 组 织 海量 文字 、 图 
片 (视频 ) , 更 好 地 连接 人 与 信息 呢 ? 如 何 根据 对 用 户 的 深度 理解 , 进行 信 
息 的 智能 推送 呢 ? 无 疑 , 人 工 智能 扮演 着 重要 角色 。 

从 内 容 创 作 、 过 滤 、 分 发 、 消 费 以 及 互动 的 每 个 环节 , 都 可 以 使 用 大 规 
模 机 器 学 习 , 包括 文本 分 析 、 自 然 语言 理解 、 计 算 机 视觉 和 数据 挖 气 等 技 
术 , 向 用 户 进行 智能 推送 。 同时, 还 可 以 基于 信息 流 丰 富 多 样 的 应 用 场景 
和 用 户 , 持续 累积 大 量 的 训练 样本 和 数据 , 让 机 器 学 习 系统 形成 闭环 ,不断 
地 改善 和 进化 , 在 机 器 人 辅助 内 容 创作 、 自 动 视频 分 析 与 理解 、 个 性 化 推荐 
和 问答 等 方面 发 展 人 工 智能 核心 技术 。 

移动 互联 网 时 代 , 很 多 信息 都 藏 在 应 用 里 面 , 虽然 不 能 利用 搜索 引擎 将 
每 个 pp 里 的 信息 轻松 找 出 , 但 是 在 这 股 潮流 中 涌现 出 一 些 新 的 应 用 , 让 我 
们 能 够 重新 定义 信息 的 源头 。 我 们 可 以 与 很 多 信息 供应 商 、 内 容 提供 商 、 
媒体 创作 者 一 起 构建 新 的 内 容 平 台 和 生态 系统 。 

当前 ， 有 更 多 的 公司 开始 大 规模 使 用 人 工 智 能 做 个 性 化 推荐 。 因 为 人 
们 使 用 智能 手机 有 了 很 多 碎片 化 时 间 , 产生 了 学 习 、 娱 乐 等 需求 。 这 些 需 
求 也 产生 了 各 式 各 样 的 应 用 场景 。 在 推荐 引擎 领域 有 了 一 个 将 人 与 信息 相 
连接 的 新 机 会 。 搜索 引擎 里 所 有 的 排序 算法 、 内 容 分 析 等 技术 , 都 可 用 于 
进一步 的 个 性 化 精准 推荐 , 从 而 变 成 信息 流 。 "信息 流 ”是 一 种 新 的 、 更 智 
能 的 方式 , 让 人 能 够 随时 随地 在 需要 时 得 到 所 需要 的 信息 。 人 工 智 能 可 以 
做 个 性 化 推荐 , 使 人 们 不 受 地 域 限 制 享受 服务 一 用 无 所 不 在 的 超级 机 器 智 
能 帮助 人 类 创作 、 发 现 、 使 用 、 分 发 信息 , 并 进行 社交 场景 的 互动 。 

当 你 使 用 在 线 系统 搜索 网 页 、 编 辑 文档 、 存 储 图 片 、 听 音乐 、 看 视频 、 
玩 游戏 , 并 享受 着 行云流水 般 的 顺畅 服务 时 , 正 有 几 十 万 到 上 百 万 人 台 服 务 器 
坚守 在 大 后 方 , 为 你 提供 着 7x 24 小 时 的 可 靠 服务 。 超大 的 规模 和 超 高 的 
复杂 度 给 服务 的 可 靠 性 、 可 用 性 和 性 能 都 带 来 了 极 大 的 挑战 。 可 靠 服务 的 
背后 是 人 们 利用 人 工 智 能 前 沿 技术 解决 大 规模 在 线 系统 服务 的 运 维 
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问题 , 即 利 用 大 规模 数据 挖掘 、 机 器 学 习 等 人 工 智 能 技术 对 纷繁 复杂 的 运 维 大 数据 进行 
实时 分 析 , 为 系统 维护 提供 有 效 的 决策 方案 。 

随 着 技术 的 进一步 发 展 , 人 工 智 能 与 人 可 以 互相 帮助 , 从 而 让 彼此 变 得 更 聪明 。 人 
工 智能 需要 很 多 标注 数据 和 训练 样本 , 在 信息 流 的 场景 , 人 们 有 更 多 机 会 拿 到 更 多 标注 
数据 以 及 更 细 颗 粒度 的 标注 ,帮助 人 们 做 自然 语言 理解 、 自 然 语 言 生成 、 图 像 视频 理解 
和 图 像 视频 生成 。 人 将 与 人 工 智能 进一步 共同 进化 。 

软件 正在 改变 全 世界 ,而 软件 产业 本 身 正在 被 人 工 智 能 的 发 展 所 颠覆 。 越 来 越 多 
的 软件 开发 不 再 只 是 依靠 软件 工程 师 的 想法 、 逻 辑 和 认 知 , 而 这 些 软件 的 核心 已 变 成 非 
常 大 的 模型 , 有 上 和 干 亿 的 参数 ,， 有 各 式 各 样 的 大 数据 。 通过 训练 各 种 各 样 的 模型 , 包含 
统计 模型 、 符 号 、 逻 辑 、 知 识 表 达 , 软件 产业 已 被 人 工 智能 化 。 

今天 , 视频 、 图 像 、 文 字 都 已 经 被 数字 化 , 下 一 个 阶段 就 是 语义 化 , 如 图 像 理解 。 
在 数字 原始 表达 空间 , 计算 机 很 难 做 语义 理解 , 我 们 需要 用 深度 学 习 模 型 来 学 习 非 线性 
的 转化 。 今天 人 工 智 能 的 本 质 其 实 是 软件 产业 的 革命 , 借 由 大 数据 、 大 计算 和 机 器 学 习 
训练 大 模型 ， 编写" 越 来 越 智能 的 软件 。 

人 工 智能 主要 分 三 层 。 最 底层 是 基础 架构 (infrastructure ) , 包括 云 计算 、 芯 片 以 及 
TensorFlow 这 样 的 框架 。 中 间 层 主要 是 使 能 技术 (enabling teqhnology ) , 如 图 像 识别 、 语 音 
识别 、 语 义理 解 、 机 器 翻译 等 。 基础 层 和 中 间 层 是 互联 网 巨头 的 必 争 之 地 , 如 芯片 领 
域 , 英特尔 、 英 伟 达 、 高 通 公司 都 投入 巨 资 , 竞争 极其 激烈 。 同样 , 云 计算 、 框 架 也 都 不 
是 小 公司 能 够 涉足 的 领地 。 

创业 公司 的 机 会 在 最 上 层 , 就 是 拿 着 下 两 层 的 成 果 服 务 垂直 行业 , 也 就 是 所 谓 的 

+"。 这样 的 趋势 在 2017 年 展现 了 不 少 案例 。 数据 + 人 氏 算 法 正在 带 来 更 多 的 想象 。 例 
如 ,英国 正在 用 氏 酿 造 啤酒 , 瑞典 通过 深度 学 习 分 析 马 匹 行为 , 纽约 通过 和 定制 二 人 干 
面 的 素食 健康 食品 。 随 着 氏 算 法 和 机 器 学 习 更 加 民主 化 , 每 一 个 行业 都 可 能 进一步 得 
到 + ” 式 的 改变 。 

深入 垂直 行业 的 +” 又 可 细 分 为 两 类 情况 : + 行业 "和 和 扰 业 +Ar" ,它们 之 间 有 
明显 的 区 别 。 

+ 行业 " 在 各 技术 成 熟 之 前 , 这 个 行业 、 产 品 从 未 存在 过 。 例如, 自动 驾驶 、 亚 
马 逊 的 Echo 智能 音箱 、 苹 果 的 Siri 语音 助手 。 在 人 工 智能 技术 未 突破 前 , 不 存在 这 样 的 
产品 。 因为 名 创 造 出 了 一 条 全 新 的 产业 链 。 

行业 +AL" 就 是 行业 本 身 , 一 直 存在 , 产业 链条 成 熟 , 只 是 以 前 完全 靠 人 工 , 效率 比 
较 低 , 现在 加 入 冬 元 素 后 , 使 得 行业 效率 有 了 明显 提高 , 如 安防 、 医 疗 等 领域 。 

+ 行业 ” 拓 业 +A 通常 因为 大 家 起 跑 线 一 样 , 行业 纵深 会 比较 浅 , 而 后 者 则 有 
巨大 的 行业 壁垒 。 未 来 行业 壁垒 才 是 人 工 智 能 创业 最 大 的 护城河 , 因为 每 个 行业 都 有 
垂直 纵深 。 以 医疗 + 氏 举 例 , 什么 最 重要 ? 大 量 准确 的 被 医生 标注 过 的 数据 最 重要 。 
没有 数据 , 再 天 才 的 科学 家 也 无 用 武之 地 。 

根据 行业 和 应 用 场景 不 同 , 人 工 智 能 的 创新 应 用 可 分 为 关键 性 应 用 " 和 ' 非 关键 
性 应 用 " 。 和 关键 性 应 用 ”如 手术 机 器 人 、 无 人 车 , 要 追求 9%.% 后 的 多 个 9, 做 不 到 就 没 
法 商业 化 。 这 类 项 目 研 发 周期 都 很 长 。 人 工 智 能 领域 的 创业 , 9% 都 是 ' 非 关键 性 应 
”, 如 人 脸 识别 门禁 系统 。 非 关键 性 应 用 "不 追求 高 大 上 , 简单 、 实 用 、 性 价 比 高 更 
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重要 , 这 样 的 项 目 通 常 是 比拼 综合 实力 , 包括 对 行业 的 洞察 理解 、 产 品 和 工程 化 能 力 、 
成 本 控制 、 供 应 链 能 力 、 营 销 能 力 。 

人 工 智能 的 钴 能 " 可 以 扩充 为 以 下 4 个 含义 : 第 一 部 分 是 紧 合 智能 ”, 即 不 同类 
型 智能 的 聚合 。 例如 , 语音 和 图 形 属于 两 个 不 同 领域 。 然而 , 人 类 的 智能 往往 是 将 各 
种 感官 获得 的 信息 (如 语音 和 图 形 ) 聚 合 , 共同 形成 认 知 。 微软 小 冰 和 微软 学 术 搜索 都 
是 聚合 智能 的 典型 案例 。 第 二 部 分 是 “ 自 适应 智能 ”， 人工 智能 必须 能 够 不 断 学 习 、 与 
时 俱 进 。 我 们 在 图 像 识别 和 智商 测试 方面 的 研究 都 很 好 地 体现 了 自 适应 智能 的 特性 。 
第 三 部 分 是 侦 形 智能 ", 目前 的 人 工 智 能 还 只 是 在 人 需要 的 时 候 才 被 动 开 启 , 未 来 , 我 
们 更 期 待人 工 智能 可 以 实现 主动 学 习 、 主 动 服 务 。 微 软 小 娜 的 跨 平台 应 用 和 视频 分 析 
技术 未 来 能 提供 的 诸多 服务 , 也 都 让 我 们 直观 地 感受 到 自动 、 无 颖 实现 的 隐形 智能 。 最 
后 是 增强 智能 "， 就 是 用 人 工 智能 这 个 了 不 起 的 “ 左 脑 ", 与 人 类 的 右 脑 相 配合 , 充分 
利用 人 类 才 有 的 创造 力 延 伸 出 无 限 可 能 。 

为 抢 抓 人 工 智 能 发 展 的 重大 战略 机 遇 , 构筑 我 国人 工 智 能 发 展 的 先 发 优 势 , 加 快 建设 
创新 型 国家 和 世界 科技 强国 , 2017 年 7 月 , 国务 院 颁发 了 《新 一 代 人 工 智能 发 展 规划 》。 

经 过 6 多 年 的 演进 , 特别 是 在 移动 互联 网 、 大 数据 、 超 级 计算 、 传 感 网 、 脑 科学 等 新 
理论 、 新 技术 以 及 经 济 社会 发 展 强烈 需求 的 共同 驱动 下 , 人工 智能 加 速 发 展 , 呈现 出 深 
度 学 习 、 跨 界 融 合 、 人 机 协同 、 群 智 开 放 、 自主 操控 等 新 特征 。 大 数据 驱动 知识 学 习 、 
跨 媒体 协同 处 理 、 人 机 协同 增强 智能 、 群 体 集 成 智能 、 自 主 智能 系统 成 为 人 工 智 能 的 发 
展 重点 , 受 脑 科学 研究 成 果 启 发 的 类 脑 智能 苹 势 待 发 , 芯片 化 、 硬 件 化 、 平 台 化 趋势 更 
加 明显 , 人 工 智 能 发 展 进入 新 阶段 。 当前 , 新 一 代 人 工 智能 相关 学 科 发 展 、 理 论 建 模 、 
技术 创新 、 软 硬件 升级 等 整体 推进 , 正在 引发 链 式 突破 , 推动 经 济 社会 各 领域 从 数字 
化 、 网 络 化 向 智能 化 加 速 跃 升 。 

《新 一 代 人 工 智能 发 展 规划 提出 以 下 三 步 走 策略 。 

到 2020 年 , 人工 智能 总 体 技术 和 应 用 与 世界 先进 水 平 同 步 , 新 一 代 人 工 智 能 理论 和 
技术 取得 重要 进展 。 大 数据 智能 、 跨 媒体 智能 、 群体 智能 、 混合 增强 智能 、 自 主 智能 系 
统 等 基础 理论 和 核心 技术 实现 重要 进展 ， 人 工 智 能 模型 方法 、 核 心 器 件 、 高 端 设备 和 基 
础 软件 等 方面 取得 标志 性 成 果 。 

到 202 年 , 人 工 智能 基础 理论 实现 重大 突破 , 部 分 技术 与 应 用 达到 世界 领先 水 平 ， 
人 工 智能 成 为 带动 我 国产 业 升 级 和 经 济 转型 的 主要 动力 , 智能 社会 建设 取得 积极 进展 。 

到 2080 年， 人工 智 能 理论 、 技 术 与 应 用 总 体 达到 世界 领先 水 平 , 智能 经 济 、 智 能 社会 
取得 明显 成 效 。 在 类 脑 智能 、 自 主 智能 、 混合 智能 和 群体 智能 等 领域 取得 重大 突破 。 

本 书 力图 体现 如 下 3 方面 特点 。 

一 是 车 础 性 " 。 包括 智能 感知 、 智 能 推理 、 智 能 学 习 和 智能 行动 所 涉及 的 基本 概念 、 
基础 理论 、 基 本 方法 , 并 通过 简单 实例 加 深 读者 对 概念 的 理解 。 内 容 涵 盖 中 国 计 算 机 学 会 
(CCF ) 术语 百科 平台 人 工 智能 分 支 的 各 个 方面 人工 智能 逻辑 、 自 动 推理 、 多 智能 体系 
统 、 机 器 学 习 、 神 经 网 络 、 智 能 机 器 人 、 模 式 识别 、 计 算 语言 学 、 知 识 工程 , 参见 CCFpedia 
(http:/Wterm.ccf.org.cn ) 和 手机 版 (http:Wtermccf.org.oymobile ) 。 

二 是 实践 性 " 。 案例 具有 实践 性 、 情 境 性 , 知识 、 概 念 、 理 论 在 教材 中 详 略 得 当地 建 
构 起 体系 后 , 就 要 通过 “ 湿 渡 流 ” 的 案例 让 读者 有 找到 感觉 、 投 身 其 中 的 可 能 。 本 书 案例 
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包括 饭店 脚本 、 在 互联 网 金融 行业 中 的 应 用 、 知 识 图 谱 应 用 、 九 宫 图 、 传 教士 -野人 问题 、 
五 子 棋 、 洞 穴 探 宝 、 八 皇后 、 旅 行商 问题 、 帆 船 分 类 专家 系统 、 抵 押 申 请 评估 决策 支持 系 
统 、 火 星 探矿 机 器 人 、 通 过 EB6 学 习 概念 ap、 基于 反 向 传播 网 络 拟 合 曲线 、 深 度 学 习 在 计算 
机 视觉 中 的 应 用 、 学 习 向 量 量化 解决 分 类 问题 、XR 问 题 、 音 节 划 分 、 深 度 学 习 在 语音 识别 
中 的 应 用 、 规 划 问 题 的 建 模 与 规划 系统 的 求解 过 程 、Shakey 世界、 仿真 机 器 人 运动 控制 算 
法 、 反 恐 作战 数据 挖掘 、 微 博 博 主 特征 行为 数据 挖掘 、 智 能 网 联 汽车 、 城 市 计算 等 。 每 一 
章 后 的 思考 题 都 为 学 生 课 后 实践 提供 了 拓展 空间 。 

三 是 前 瞻 性 ” 。 近 几 年 , 人 工 智 能 莲 勃 发 展 , 基础 性 、 应 用 性 成 果 很 多 。 在 介绍 
智能 感知 、 智 能 推理 、 智 能 学 习 和 智能 行动 应 用 进展 时 , 体现 了 最 新 研究 成 果 。 此 外 ， 
1.5 节 “人 工 智能 发 展 展望 ”中 包括 新 一 轮 人 工 智 能 发 展 特征 、 未 来 0 年 的 人 工 智 能 问 
题 、 人 工 智能 鲁 棒 性 和 伦理 、 新 一 代 人 工 智能 发 展 规划 。 11.5 节 “集体 智能 ”" 中 包括 社 
群 智能 、 集体 智 能 系统 、 全 球 脑 、 云 脑 、 智 联网 等 前 瞻 理 论 和 应 用 场景 。 

第 2 版 附录 A "人 工 智能 程序 设计 语言 Prolog” 在 本 版 调整 为 附录 A “人 工 智 能 编程 语 
言 Python" 和 附录 B 手写 体 识别 案例 ”。 在 教学 中 , 如 果 需 要 继续 使 用 Prolog 相关 资料 ， 
可 取 阅 清华 大 学 出 版 社 提供 的 相应 电子 版 资源 。 

第 2 版 附录 B "人 工 智能 大 作业 ”, 在 本 书 中 做 了 如 下 处 理 ， 部 分 问题 在 正文 中 以 案 
例 的 方式 给 出 了 解答 , 如 九宫 图 (第 2 章 )、 传 教士 -野人 问题 (第 2 章 )、 五 子 棋 (第 3 
章 )、 洞 穴 探 宝 (第 3 章 )、 八 皇后 (第 3 章 )、 音 节 划 分 (第 8 章 ) 。 部 分 问题 以 思考 题 
的 形式 放 到 各 章 习题 中 , 如 NM 问题 (第 1 章 )、 人 工 智 能 军事 应 用 跟踪 (第 1 章 )、 计 算 
机 游戏 如 何 产生 娱乐 效果 (第 1 章 ) ; 水 壶 问题 (第 2 章 )、 魔 方 (第 2 章 )、 奥 木 (第 2 
章 )、 合 一 算法 (第 2 章 )、 归 类 测试 算法 (第 2 章 ) ; 中 国 象 棋 (第 3 章 )、 围 棋 (第 3 
章 ) ; 小 型 动物 分 类 专家 系统 (第 5 章 ) ; 火星 探测 者 Agent (第 6 章 ) 、 用 于 电力 管理 的 多 
Agert 系统 (第 6 章 ) ; 用 神经 网 络 对 大 写字 母 分 类 (第 7 章 ); 美国 地 理 (第 8 章 ) ; 
Elsevier 的 横向 信息 产品 (第 11 章 ) 、 奥 迪 的 数据 整合 (第 11 章 )、 人 寿 保险 公司 的 技能 
寻 获 (第 11 章 )、 在 线 学 习 (第 11 章 )、 警 察 局 的 多 媒体 收藏 索引 (第 11 章 ) 、 康 富 的 在 
线 采购 (第 11 章 )、 数 码 设 备 的 可 共用 性 (第 11 章 ) 。 

本 书 第 3 4 9 10 章 由 张 彦 铎 撰写 , 毛 新 军 参与 第 6 章 撰写 , 其 余 各 章 由 奠 可 荣 所 
写 。 全 书 由 责 可 荣 统 稿 。 蒙 敦 波 参与 了 第 3 4、9、10 章 的 修订 , 何 智 勇 撰 写 了 ' 附 录 A 
人 工 智能 编程 语言 python" 和 “附录 B 手 写 体 识别 案例 ”, 张 毅 伟 参 与 了 绘图 工作 , 张 献 
参与 了 审 校 , 陈 志 刚 教授 对 全 书 进行 了 审 校 , 清华 大 学 出 版 社 张 瑞 庆 编审 推动 和 指导 了 
本 书 撰写 , 在 此 一 并 致谢 。 

感谢 所 有 参考 文献 的 作者 , 感谢 “中国 计算 机 学 会 通讯 ”中国 人工 智能 学 会 通 
讯 ”、 中 国 计 算 机 学 会 技术 动态 " 相关 论文 作者 。 
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智能 与 意识 、 思 维和 记忆 以 及 问题 求解 、 直 觉 、 创造 性 、 语 言 和 学 习 有 
关 , 而 且 还 与 理解 和 感觉 , 如 运动 技能 、 预测 环境 能 力 、 处理 复杂 世界 的 能 
力 、 在 学 校 和 人 Q 测 试 的 表现 等 有 关 。 


智能 与 人 工 智能 


1. 智能 的 定义 

智能 的 定义 有 多 种 , 如 智能 是 进行 抽象 思维 的 能 力 ” ' 智 能 是 学 习 或 
者 从 经 验 中 获 益 的 能 力 ” 智能 是 学 习 到 的 或 者 学 习 以 调 整 自己 适应 环境 的 
能 力 ” "智能 是 充分 调整 自己 去 适应 生命 中 的 相对 较 新 的 情况 ” ' 智 能 是 接 
受 知 识 的 能 力 以 及 所 拥有 的 知识 " 等 , 但 要 理解 这 些 定义 , 最 好 的 方法 是 通 
过 问题 体会 。 

通过 寻找 感 兴趣 的 问题 推进 研究 (例如 , 狗 如 何 会 跑 并 且 抓 住 飞盘 ; 为 
什么 老鼠 很 快 学 会 在 迷宫 中 寻找 方向 ; 蚂蚁 在 寻找 食物 的 长 途 旅行 之 后 如 
何 寻 找到 回 到 集 穴 的 路 ; 人 如 何 走路 ; 人 如 何在 一 堆 人 中 认 出 一 张 面孔 )， 
然后 尝试 了 解 这 种 特定 的 行为 如 何 产 生 。 是 否 愿意 把 这 些 行 为 称 作 智能 ， 
依赖 于 个 人 偏好 。 

我 们 在 直觉 上 认为 的 智能 , 总 是 包括 两 个 特殊 性 质 : 顺应 性 和 多 样 性 。 
简 言 之 , 主体 (Agent ) 总 是 遵从 其 所 处 环境 的 自然 和 社会 规则 , 利用 这 些 规 
则 去 产生 多 样 行 为 。 例如 , 所 有 动物 、 人 类 以 及 机 器 人 必须 遵从 存在 重力 
和 摩擦 以 及 移动 需要 能 量 的 事实 , 绝 不 可 能 完全 摆脱 这 些 。 但 是 , 适应 并 
以 一 定 方式 利用 这 些 限制 条 件 使 我 们 能 够 走路 、 奔 跑 、 从 杯子 中 喝 水 、 将 盘 
子 放 到 桌子 上 、 踢 足球 或 骑 自 行车 。 多 样 性 意味 着 主体 能 够 进行 多 种 行 
为 ,这样 他 / 它 能 够 对 给 定 的 情况 做 出 适当 反应 。 一 个 仅 走 路 , 或 仅 下 棋 ， 
或 仅 奔 跑 的 主体 在 直觉 上 比 起 能 用 积木 搭 出 玩具 汽车 、 把 啤酒 倒 进 杯子 和 
在 一 群 挑 剔 的 听众 面前 讲课 的 主体 缺少 智能 。 在 智能 的 许多 定义 中 被 提 到 
的 学 习 是 一 种 随时 间 而 增加 行为 多 样 性 的 有 效 手段 。 

直觉 上 , 我 们 认为 一 些 行为 比 另 外 一 些 需 要 更 多 的 思考 , 一 些 动物 比 另 
外 一 些 更 聪明 。 在 一 般 用 法 中 , 思考 经 常 与 有 意识 的 思想 相 联系 ; 认 知 
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则 更 一 般 化 , 用 于 同感 觉 -运动 过 程 非 直接 相关 的 行为 中 ; 智能 则 更 加 一 般 化 , 包含 各 种 
对 主体 有 益 的 认 知 和 思考 等 抽象 行为 。 智能 是 先天 的 还 是 后 天 的 , 即 智 能 在 多 大 程度 
上 来 自 遗传 或 是 在 一 生 中 所 获取 的 ? 可 以 用 智能 区 分 开 人 类 和 其 他 物种 吗 ? 

2. 人 工 智 能 的 研究 内 容 

人 工 智能 研究 的 是 智能 行为 中 的 机 制 , 它 是 通过 构造 和 评估 那些 试图 采用 这 些 机 制 
的 人 工 制品 进行 研究 的 。 在 这 个 定义 中 , 人 工 智 能 不 像 是 关于 智能 机 制 的 理论 , 更 像 是 
一 种 经 验 主义 的 方法 学 , 它 的 主要 任务 是 构造 和 测试 支持 这 种 理论 的 可 能 模型 。 它 是 
一 种 对 实验 进行 设计 、 运 行 和 评估 的 科学 方法 , 其 目的 是 精练 模型 和 进行 更 深入 的 
实验 。 

人 工 智能 的 经 验 主义 的 方法 学 是 一 个 重要 的 工具 , 也 许 它 对 于 探索 智能 的 本 质 来 说 
是 最 好 的 工具 。 

人 工 智 能 属于 交叉 学 科研 究 领 域 , 本 质 上 具有 3 个 目标 : 四 了 解 生 物 系 统 (也 就 是 
引起 人 类 或 动物 智能 行为 的 机 制 ) ，@) 智 能 行为 一 般 原 则 的 抽象 提取 ，@@ 应 用 这 些 原则 
设计 有 用 的 人 造物 。 这 里 的 机 制 不 仅 是 指 神经 机 制 或 者 大 脑 过 程 , 也 指 主体 的 身体 及 
其 同 真实 世界 的 交互 。 如 肌肉 具有 弹性 , 当 一 条 腿 抬 起 时 , 另 一 条 腿 承 受 的 重量 增加 的 
事实 , 和 与 步行 紧密 相关 的 反射 和 大 脑 中 枢 一 样 是 步行 机 制 的 有 机 组 成 。 

如 果 人 工 智能 想 达 到 科学 的 水 平 并 成 为 智能 系统 科学 的 关键 组 成 部 分 , 就 必须 在 它 
制造 的 人 工 制品 的 设计 、 执行 和 分 析 中 包含 分 析 和 经 验 式 的 方法 。 从 这 种 观点 看 , 每 个 
人 工 智 能 程序 都 可 以 看 作 是 一 个 实验 ， 它 向 现实 世界 提出 问题 , 而 答案 就 是 现实 世界 对 
此 做 出 的 响应 。 现实 世界 对 我 们 的 设计 做 出 的 响应 和 程序 式 的 承诺 构成 了 我 们 对 于 智 
能 的 形式 方法 、 机 理 以 及 智能 本 质 的 理解 。 

3. 智能 的 计算 特性 

智能 的 计算 特性 开始 于 对 计算 设备 的 抽象 规范 说 明 。 2 世纪 30 年 代 到 50 年 代 的 研 
究 开 启 了 这 一 探索 ，Turing (图 灵 )、Post (波斯 特 ) 、Markov (马尔 可 夫 )、Churdh ( 丘 奇 ) 等 
人 在 对 计算 的 形式 化 描述 方面 做 出 了 极 大 贡献 。 这 些 研究 的 目的 不 是 仅 指出 计算 的 含 
义 ， 还 指出 关于 可 计算 的 界限 。 通用 图 灵机 是 大 家 熟知 的 规约 , 波斯 特 重 写 规则 可 作为 
产生 式 系统 计算 基础 。 基于 部 分 递归 函数 的 丘 奇 模型 , 支持 诸如 Scheme、0cam1 和 Standard 
人 L 等 现代 高 级 函数 式 语 言 。 

所 有 这 些 形式 化 方法 都 具有 等 价 的 计算 能 力 。 可 以 说 , 通用 图 灵机 等 价 于 现代 的 
任意 计算 设备 。 没有 哪个 计算 模型 能 够 定义 得 比 这 些 已 知 模型 更 强 ( 丘 奇 -图 灵 命 题 ) 。 
一 旦 建立 了 计算 规约 的 等 价 性 , 我 们 就 从 这 些 规 约 的 机 械 化 工具 中 解放 出 来 : 我 们 可 以 
用 电子 管 、 硅 芯片 、 细 胞 质 或 者 普通 玩具 实现 我 们 的 算法 。 在 一 种 媒介 上 的 自动 设计 机 
制 等 价 于 在 另外 一 种 媒介 上 设计 的 机 制 。 因此 , 当 我 们 在 一 种 媒介 上 测试 在 另 一 种 媒 
介 上 实现 的 机 制 时 , 就 使 得 经 验 式 探 索 的 方法 变 得 更 加 重要 。 

有 一 种 可 能 就 是 , 图 灵 和 波斯 特 的 通用 机 器 也 许 太 泛 化 、 太 通用 了 。 这 里 矛盾 的 
是 , 智能 可 能 并 不 需要 很 强 的 带 集中 控制 的 计算 机 制 。 Levesque 等 人 建议 人 的 智能 可 
需要 更 多 的 计算 性 的 有 效 的 表示 (如 用 于 推理 的 tm 子 句 )、 对 基文 字 的 实际 知识 的 约 
束 以 及 可 计算 跟踪 的 真 值 维 护 系统 的 使 用 。 智能 的 基于 主体 的 模型 和 涌现 模型 似乎 也 
支持 这 种 观点 。 
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我 们 的 机 制 模型 的 形式 化 等 价 性 引出 的 另 一 个 论点 是 , 二 元 性 问题 和 心身 (mind- 
body ) 问题 。 笛 卡 儿 时 代 以 后 , 哲学 家 们 就 提出 了 智能 、 意识 和 身体 之 间 的 交互 和 整合 
问题 。 他 们 给 出 了 每 种 可 能 的 反映 , 从 完全 的 唯物 主义 到 对 物质 存在 的 否定 , 甚至 到 支 
持 上 帝 的 介入 ! 人 工 智能 和 认 知 科学 的 研究 否认 了 笛 卡 儿 的 二 元 论 , 而 支持 基于 物理 
实现 或 者 符号 实例 的 智能 的 物质 模型 , 支持 管理 这 些 符号 的 计算 机 制 的 形式 化 规约 , 支 
持 表示 范例 的 等 价 性 , 支持 在 具体 模型 中 知识 和 技能 的 机 械 化 。 这 种 研究 的 成 功 表明 
了 这 种 模型 的 有 效 性 。 


关于 物理 系统 中 智能 的 认识 论 基础 














1. 表示 问题 

Allen Newell 和 Herbert Simon 假定 物理 符号 系统 和 搜索 对 于 智能 的 特性 是 充分 必要 的 。 
神经 模型 或 子 符号 模型 的 成 功 、 智 能 的 遗传 和 涌现 方法 的 成 功 是 否 是 对 物理 符号 假设 的 
一 种 驳斥 , 或 者 它们 是 这 种 假设 的 简单 实例 吗 ? 

连 这 种 假设 的 弱 解释 一 物理 符号 系统 是 智能 的 一 个 充分 模型 一 在 现代 认 知 科学 领 
域 中 也 产生 了 许多 强大 的 、 有 用 的 结果 。 这 种 观点 认为 ,我们 可 以 实现 那些 能 说 明智 能 
行为 的 物理 符号 系统 。 充分 性 使 得 我 们 能 够 为 人 所 具有 的 许多 方面 的 性 能 创建 和 测试 
基于 符号 的 模型 。 但 是 , 这 个 假设 的 强 解释 一 物理 符号 系统 和 搜索 对 于 智能 活动 是 必 
要 的 一 仍然 是 一 个 有 待 研究 和 解决 的 问题 。 

2. 认 知 中 具体 化 的 作用 

物理 符号 系统 假设 的 主要 假定 之 一 就 是 , 物理 符号 系统 的 特定 实例 化 是 与 其 性 能 无 
关 的 ; 其 主要 内 容 是 其 形式 化 结构 。 许多 研究 者 都 对 这 一 点 提出 了 挑战 , 他 们 指出 智能 
行为 的 需求 要 求 一 种 允许 主体 整合 到 世界 中 的 物理 具体 化 。 现代 计算 机 的 结构 并 不 允 
许 这 种 程度 的 情形 , 而 是 要 求 一 个 人 工 智 能 通过 极端 有 限 的 窗口 (同时 代 的 输入 输出 设 
备 ) 同 世界 进行 交互 。 如 果 这 种 挑战 是 正确 的 , 则 尽管 出 现 机 器 智能 , 它 仍 需要 同时 代 
的 计算 机 提供 一 个 非常 相同 的 接口 。 

3. 文化 与 智能 

传统 上 , 人工 智能 侧重 于 把 个 体 智能 作为 智能 的 来 源 ; 我 们 的 行动 好 像 在 说 , 对 于 
大 脑 编码 和 怎样 管理 知识 的 方法 的 解释 可 能 是 原始 智能 的 一 种 完整 解释 。 然而 , 我 们 

会 认为 知识 最 好 被 看 作 是 基于 社会 的 , 而 不 是 一 个 个 体 所 构造 的 。 在 基于 记忆 的 智 
能 理论 中 , 社会 本 身 也 带 有 智能 的 本 质 组 件 。 对 于 智能 理论 来 说 , 对 知识 的 社会 环境 和 
人 类 行为 的 理解 , 同 对 个 体 智能 /大 脑 的 理解 是 同等 重要 的 。 

4. 刻画 解释 的 本 质 

在 表示 传统 研究 中 , 大 多 数 模型 一 般 工作 在 已 经 解释 好 的 领域 中 , 即 对 于 解释 的 上 
下 文 , 系统 设计 者 通常 都 会 给 出 一 些 隐 含 的 、 先 验 约 定 , 在 这 种 约定 下 , 很 难 随 着 问题 
求解 过 程 的 进展 而 将 上 下 文 、 目 标 或 表示 进行 转换 。 目前 还 很 少 有 成 果 能 够 阐明 人 类 
构造 解释 的 过 程 。 

Tarskian 的 观点 ' 将 语义 作为 符号 和 对 象 之 间 的 映射 " 还 是 太 弱 并 不 能 解释 一 些 事 
实 , 如 一 个 领域 在 不 同 实践 目标 的 指引 下 可 能 会 有 不 同 的 解释 。 语言 学 家 试图 通过 语 
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用 理论 弥补 Tarskian 语义 的 局 限 性 。 论述 分 析 基 本 依赖 于 上 下 文中 符号 的 使 用 , 已 经 在 
近 几 年 中 广泛 地 讨论 了 这 些 问题 , 但 是 , 这 个 问题 涉及 的 内 容 事实 上 还 要 更 加 广泛 , 因 
为 它 通常 还 要 处 理 参考 工具 的 失败 。 

C. S. Peirce 最 先 倡导 符号 语言 学 的 传统 ,后续 的 研究 者 还 有 Eco、Seboek 以 及 其 他 学 
者 , 他 们 对 于 语言 采用 了 更 激进 的 方法 。 这 种 符号 语言 学 的 传统 把 符号 表达 式 放 在 广 
泛 的 记号 和 记号 解释 中 , 它 表 明 , 符号 的 含义 只 有 在 它 用 作 解 释 的 上 下 文中 才能 够 被 理 
解 , 即 在 解释 的 上 下 文中 或 在 与 环境 的 交互 中 才能 被 理解 。 

5. 表示 的 不 确定 性 

Anderson 的 表示 不 确定 性 猜想 指出 , 在 熟练 性 能 的 特定 动作 这 种 环境 下 , 确定 哪 种 表 
示 模 式 最 接近 于 人 的 问题 求解 器 在 理论 上 是 不 可 能 的 。 这 种 猜想 是 基于 这 样 的 事实 ， 
即 每 个 表示 模式 不 可 避免 地 被 连接 到 一 个 大 型 的 计算 结构 , 就 像 搜 索 策 略 一 样 。 在 对 
人 类 技能 的 详细 分 析 中 , 我 们 不 可 能 充分 控制 这 个 过 程 , 使 得 我 们 能 决定 这 个 表示 ; 也 
不 可 能 为 过 程 被 唯一 确定 的 那些 点 建立 一 个 表示 。 由 物理 的 不 确定 原理 , 现象 可 以 通 
过 检验 这 个 现象 的 过 程 加 以 改变 , 因此 , 构造 智能 模型 是 需要 重点 关注 的 , 但 没有 必要 
限制 它们 的 利用 。 

6. 设计 可 以 反 证 的 计算 模型 的 必要 性 

Popper 等 人 指出 科学 理论 必定 是 可 以 反 证 的 , 这 就 是 说 , 必定 存在 一 种 环境 , 使 得 在 
此 环境 下 的 这 个 理论 模型 并 不 是 对 这 种 现象 的 成 功 的 近似 。 任何 数目 的 确定 性 实验 实 
例 都 不 能 充分 地 确定 一 个 模型 。 许多 研究 是 在 已 有 理论 的 失败 的 基础 上 进行 的 。 

物理 符号 系统 假设 的 一 般 本 质 正 如 智能 的 情景 模型 和 涌现 模型 一 样 , 作为 一 种 模型 
在 使 用 上 受到 限制 。 同样, 可 以 对 关于 现象 学 传统 的 假设 进行 批评 。 一 些 人 工 智 能 数 
据 结构 (如 语义 网 ) 还 是 很 普通 的 , 使 得 它们 可 以 建 模 几乎 所 有 能 够 描述 出 的 东西 , 或 
者 正 像 通 用 图 灵机 一 样 , 使 得 它们 可 以 建 模 任意 的 可 计算 函数 。 因此 , 一 个 人 工 智 能 研 
究 者 或 者 认 知 科学 家 被 问 到 在 什么 条 件 下 他 们 的 智能 模型 不 能 用 时 , 给 出 答案 经 常 是 很 
难 的 。 

7. 科学 方法 的 局 限 性 

许多 研究 者 们 宣称 智能 的 最 重要 方面 就 是 没有 被 模型 化 , 并 且 原 则 上 不 可 能 被 模型 
化 , 且 特别 是 不 能 使 用 任意 的 符号 表示 来 模型 化 。 这 些 领 域 包括 学 习 、 自 然 语 言 理解 、 
说 话 动作 的 产生 等 。 这 些 问题 已 经 深 深 地 植 根 于 我 们 的 哲学 理念 中 。 

现代 人 工 智能 的 大 部 分 假设 追 其 根源 , 可 以 回溯 到 Camap、Frege 和 Leibniz, 再 远 回溯 
到 Hobbes、Loke 和 Hume, 直至 回溯 到 亚 里 士 多 德 。 这 种 传统 观点 认为 ， 智能 的 处 理 过 程 
符合 通用 法 则 , 并 且 在 原则 上 是 可 以 被 理解 的 。 

Heideggei 和 他 的 追随 者 们 描述 了 一 种 可 选择 的 方法 理解 智能 。 对 于 Heidegger 来 说 ， 
思考 的 意识 源 于 具体 经 验 的 世界 (一 种 生命 世界 ) 。 Winograd、Flores 和 Dreyfus 等 人 认为 
一 个 人 对 事物 的 理解 是 扎根 于 在 每 天 的 世界 中 使 用 "这些 理 解 的 实际 活动 中 。 这 种 世 
界 在 本 质 上 是 一 种 环境 , 其 中 包括 按 社会 方式 组 织 的 各 种 作用 和 目的 。 而 这 种 环境 以 
及 其 中 的 人 的 功能 不 是 通过 命题 解释 的 , 也 不 是 能 够 被 定理 所 理解 的 。 它 更 像 是 一 种 
不 断 形成 的 流程 。 在 基本 意义 上 , 人 类 专家 并 不 知道 是 什么 ”, 而 只 是 知道 在 进化 的 
社会 标准 和 隐 含 的 目的 不 断 发 展 的 世界 中 , 它 是 怎么 样 的 。 我 们 不 能 自然 地 就 把 我 们 
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的 知识 和 大 多 数 智能 行为 放 入 语言 中 , 不 管 是 形式 的 , 还 是 自然 的 。 

现在 让 我 们 来 考虑 上 述 这 种 观点 。 首先 , 作为 对 纯 理 性 主义 传统 的 批判 , 这 种 观点 
是 正确 的 。 理性 主义 者 断言 , 所 有 的 人 类 活动 、 智 能 和 责任 , 至 少 原则 上 能 够 被 表示 、 
形式 化 和 理解 。 大 多 数 喜欢 思考 的 人 们 并 不 相信 这 种 情形 , 他 们 认为 情感 、 自 我 主张 和 

责任 的 承诺 等 (至 少 ) 也 是 很 重要 的 。 在 科学 方法 的 领域 之 外 , 还 有 很 多 人 类 活动 在 
可 靠 的 人 类 交互 中 起 着 本 质 的 作用 。 这 些 不 可 能 被 机 器 再 生 或 者 取消 。 

然而 , 检查 数据 、 构 造 模型 、 运 行 实验 以 及 为 了 进一步 实验 而 使 用 模型 精练 检查 结 
果 等 这 些 科 学 传统 已 经 进入 理解 、 解 释 和 预言 人 类 社会 能 力 这 样 一 个 重要 的 层次 。 科 
学 方法 是 提高 人 类 理解 能 力 的 一 个 有 力 工 具 。 尽管 如 此 , 对 于 这 种 方法 , 这 里 仍然 有 许 
多 的 告诫 是 研究 人 员 必 须 理解 的 。 

首先 , 研究 人 员 不 要 把 这 个 模型 与 被 建 模 的 现象 相 混 淆 。 模型 能 允许 我 们 不 断 地 
蔓 近 这 种 现象 ; 通常 , 这 里 必然 有 一 些 不 能 使 用 经 验 解 释 的 “残留 物 " 。 在 这 种 意义 
上 ， 表示 不 确定 性 并 不 是 一 个 问题 。 一 个 模型 是 用 来 探索 、 解释 和 预言 的 ; 如 果 它 允许 
研究 人 员 完 成 这 些 任 务 , 则 它 就 是 成 功 的 。 对 于 一 种 简单 的 现象 , 不 同 的 模型 可 以 用 来 
解释 这 种 现象 的 不 同方 面 。 

此 外 , 当 研 究 者 们 主张 智能 现象 的 各 个 方面 已 经 在 科学 传统 的 范围 和 方法 之 外 时 
这 种 说 法 本 身 也 只 能 用 那些 科学 传统 验证 。 科学 方法 只 是 一 种 工具 , 它 可 用 来 解释 在 
什么 意义 上 问题 仍然 是 在 我 们 当前 的 理解 之 外 。 每 种 观点 , 甚至 是 来 自 于 现象 学 传统 
的 观点 , 如 果 它 是 有 一 定 含义 的 , 那么 它 一 定 跟 我 们 当前 某 些 解释 的 概念 相关 , 甚至 它 
是 与 那些 不 能 解释 的 现象 相关 联 的 。 

人 工 智能 研究 中 最 让 人 振奋 的 方面 是 对 我 们 必须 解决 的 这 些 问 题 做 出 不 懈 的 努力 和 
贡献 。 为 了 理解 问题 求解 、 学 习 和 语言 , 必须 领会 表示 和 知识 的 哲学 层面 含义 。 我 们 
被 要 求 用 一 种 谦卑 的 方式 解决 亚 里 士 多 德 的 理论 和 实践 之 间 的 关系 问题 , 以 形成 理解 和 
实践 的 统一 、 理 论 和 实践 的 统一 , 在 科学 与 艺术 中 生活 。 

人 工 智能 工作 者 是 工具 的 制造 者 。 我 们 的 表示 、 算法 和 语言 都 是 一 些 工 具 , 用 来 设 
计 和 建立 那些 展现 智能 行为 的 机 制 。 通过 实验 , 我 们 同时 检验 了 它们 解决 问题 的 计算 
适合 性 , 也 检验 了 我 们 自己 对 智能 现象 的 理解 。 








智能 系统 


人 工 智能 研究 的 一 个 最 重要 的 动力 是 建立 智能 系统 , 以 求解 困难 问题 。 20 世纪 8 
年 代 以 来 , 知识 工程 成 为 人 工 智能 应 用 最 显著 的 特点 , 专家 系统 、 知 识 库 系 统 、 智 能 决 
策 系统 等 智能 系统 得 到 广泛 应 用 。 知识 库 系统 是 把 知识 以 一 定 的 结构 存 入 计算 机 , 进 
行 知 识 的 管理 和 问题 求解 , 实现 知识 的 共享 。 

建造 智能 系统 可 以 模仿 、 延 伸 和 扩展 人 的 智能 , 实现 某 些 "机 器 思维 ", 具有 极 大 的 
理论 意义 和 实用 价值 。 根据 智能 系统 具有 的 知识 和 处 理 范 型 的 情况 , 可 以 分 成 4 类 : 中 
单 领域 知识 单 处 理 范 型 智能 系统 ; @@ 多 领域 知识 单 处 理 范 型 智能 系统 ; 图 单 领域 知识 
多 处 理 范 型 智能 系统 ，@ 多 领域 知识 多 处 理 范 型 智能 系统 。 
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1. 单 领域 知识 单 处 理 范 型 智能 系统 

系统 具有 单一 领域 的 知识 , 并 且 只 有 一 种 处 理 范 型 。 例如 , 第 一 代 、 第 二 代 专 家 系 
统 和 智能 控制 系统 都 属于 这 种 类 型 。 

专家 系统 是 运用 特定 领域 的 专门 知识 , 通过 推理 模拟 通常 由 人 类 专家 才能 解决 的 各 
种 复杂 的 、 具 体 的 问题 , 达到 与 专家 具有 同等 解决 问题 能 力 的 计算 机 智能 程序 系统 。 它 
能 对 决策 的 过 程 作出 解释 , 并 有 学 习 功 能 , 即 能 自动 增长 解决 所 需 的 知识 。 第 一 代 专 家 
系统 (如 DENDRAL、MACSYMA 等 ) 以 高 度 专业 化 、 求 解 专门 问题 的 能 力 强 为 特点 , 但 在 体系 结 
构 的 完整 性 、 可 移植 性 等 方面 存在 缺陷 , 求解 问题 的 能 力 弱 。 第 二 代 专 家 系统 (如 
MYCIN、CASNET、PROSPECTOR、HEAR-SAY 等 ) 属 单 学 科 专业 型 、 应 用 型 系统 , 其 体系 结构 较 完 整 ， 
移植 性 方面 也 有 所 改善 ,而 且 在 系统 的 人 机 接口 、 解 释 机 制 、 知 识 获取 技术 、 不 确定 推 
理 技 术 、 增 强 专家 系统 的 知识 表示 和 推理 方法 的 启发 性 、 通 用 性 等 方面 都 有 所 改进 。 

2. 多 领域 知识 单 处 理 范 型 智能 系统 

多 领域 知识 单 处 理 范 型 智能 系统 具有 多 种 领域 的 知识 , 而 处 理 范 型 只 有 一 种 。 大 
多 数 分 布 式 问题 求解 系统 、 多 专家 系统 都 属于 这 种 类 型 。 一 般 采 用 专家 系统 开发 工具 
和 环境 研制 这 种 大 型 综合 智能 系统 。 

由 于 智能 系统 在 工程 技术 、 社 会 经 济 、 国 防 建设 、 生 态 环境 等 各 个 领域 的 广泛 应 
用 , 对 智能 系统 的 功能 提出 多 方面 的 要 求 。 许 多 实际 问题 的 求解 , 例如, 医学 诊治 、 经 
济 计划 、 军 事 指挥 、 金融 工程 、 作 物 栽培 、 环境 保护 等 , 往往 需要 应 用 多 学 科 、 多 专业 的 
专家 知识 和 经 验 。 现 有 的 许多 专家 系统 大 多 数 是 单 学 科 、 专 门 性 的 小 型 专家 系统 , 不 能 
满足 用 户 的 实际 需求 。 建立 多 领域 知识 单 处 理 范 型 智能 系统 在 一 定 程度 上 可 以 达到 用 
户 的 要 求 。 

这 类 智能 系统 的 特点 是 : 面向 用 户 实际 的 复杂 问题 求解 ; 应 用 多 学 科 、 多 专业 、 多 
专家 的 知识 和 经 验 , 进行 并 行 协同 求解 ; 基于 分 布 式 、 开 放 性 软 硬 件 和 网 络 环境 ; 利用 
专家 系统 开发 工具 和 环境 ; 实现 知识 共享 与 知识 重用 。 

3. 单 领域 知识 多 处 理 范 型 智能 系统 
单 领域 知识 多 处 理 范 型 智能 系统 具有 单一 领域 的 知识 , 而 处 理 范 型 有 多 种 。 例如 ， 
混合 智能 系统 属于 这 种 类 型 。 一 般 可 以 用 神经 网 络 通过 训练 获得 知识 , 然后 转换 成 产 
生 式 规则 提供 给 推理 机 在 求解 问题 时 使 用 。 

在 进行 问题 求解 时 , 也 可 以 采用 多 种 机 制 处 理 同一 个 问题 。 例如 , 疾病 诊断 系统 既 
可 采用 符号 推理 的 方法 , 也 可 通过 人 工 神经 网 络 让 它们 同时 处 理 相同 的 问题 , 然后 比较 
它们 的 结果 , 这 样 容易 取得 正确 的 结果 , 避免 片面 性 。 

4. 多 领域 知识 多 处 理 范 型 智能 系统 

这 种 系统 具有 多 种 领域 的 知识 , 而 且 处 理 范 型 也 有 多 种 。 这 种 系统 包含 一 集体 智 
能 模块 , 其 含义 是 , 在 多 种 处 理 范 型 的 环境 下 , 各 种 处 理 机 制 各 行 其 是 , 各 司 其 职 , 协调 
工作 , 表现 为 集体 的 智能 行为 。 

综合 决策 系统 、 综 合 知识 系统 属于 多 领域 知识 多 处 理 范 型 智能 系统 。 在 这 种 系统 
中 , 基于 推理 的 抽象 思维 采用 符号 处 理 的 方法 ; 而 基于 模式 识别 、 图 像 处 理 之 类 的 形象 
思维 采用 神经 计算 。 

在 总 结 和 分 析 已 有 智能 系统 的 设计 方法 和 实现 技术 的 基础 上 , 采用 智能 主体 





























第 2 版 广 一 0 


(Agert ) 技术, 实现 具有 多 种 知识 表示 、 综 合 知识 库 、 自 组 织 协同 工作 、 自 动 知识 获取 等 
功能 的 大 型 综合 智能 系统 。 这 类 系统 是 当前 实现 多 领域 知识 多 处 理 范 型 智能 系统 的 主 
要 途径 。 

现实 世界 的 问题 多 数 具有 病态 结构 , 研究 的 对 象 也 在 不 断 变 化 , 很 难 找到 一 种 精确 
的 算法 进行 求解 。 构造 人 机 统一 , 与 环境 进行 交互 、 反 馈 的 开放 系统 是 解决 这 类 智能 问 
题 的 途径 。 所 谓 开 放 系 统 , 是 指 系统 在 操作 过 程 中 永远 有 难以 预料 的 后 果 , 并 能 在 任何 
时 候 从 外 部 接收 新 的 信息 。 

互联 网 已 经 成 为 各 类 信息 资源 的 聚集 地 。 在 这 些 海量 的 、 异 构 的 Web 信息 资源 中 ， 
蕴涵 着 具有 巨大 潜在 价值 的 知识 。 通过 Web 内 容 发 现 、 结 构 发 现 、 使 用 发 现 等 , 能 够 从 
Web 上 快速 、 有 效 地 发 现 资源 和 知识 , 提高 在 web 上 检索 信息 、 利 用 信息 的 效率 。 互联 网 
上 的 维基 百科 反映 了 集体 智能 的 特点 和 优势 , 受到 社会 人 士 的 欢迎 和 好 评 。 


展望 智能 科学 与 技术 


智能 科学 与 技术 本 身 的 发 展 正在 向 理论 创新 的 深入 和 大 规模 实际 应 用 发 展 。 在 2009 
年 中 国 科学 技术 协会 公布 的 “10 项 引领 未 来 的 科学 技术 " 评选 结果 中 , 作为 智能 科学 与 
技术 核心 的 “人 工 智能 技术 " 排 在 第 4 位 , 作为 智能 科学 与 技术 重要 应 用 的 ' 款 来 家 庭 服 
务 机 器 人 " 排 在 第 2 位 , 这 充分 显示 了 智能 科学 与 技术 的 巨大 潜力 和 极其 广泛 的 社会 
影响 。 

在 过 去 8 多 年 的 人 工 智 能 研究 中 , 人 们 一 直 沿 着 入 拟 脑 ”的 方向 做 出 努力 , 分别 
从 智能 系统 的 结构 、 功 能 、 行 为 3 个 基本 侧面 展开 对 智能 的 研究 , 这 样 便 先 后 形成 了 模 
拟 大 脑 抽 象 思 维 功能 的 符号 智能 学 说 、 模 拟 大 脑 结 构 的 神经 网 络 学 说 以 及 模拟 智能 系统 
行为 的 感知 -动作 系统 学 说 。 由 于 社会 的 迫切 需要 , 呼唤 着 智能 科学 与 技术 在 理论 上 取 
得 突破 , 在 应 用 上 广泛 普及 。 展望 智能 科学 与 技术 的 发 展 , 可 以 开展 以 下 3 方面 的 
研究 。 

(1) 智能 科学 。 智能 科学 是 脑 科学 、 认 知 科学 、 人 工 智 能 等 的 交叉 学 科 , 研究 智能 
的 理论 和 技术 。 智能 科学 不 仅 要 进行 智能 的 功能 仿真 , 而 且 要 研究 智能 的 机 理 。 脑 科 
学 从 分 子 层次 、 细 胞 层次 、 行 为 层次 研究 自然 智能 机 理 , 建立 脑 模型 , 揭示 人 脑 的 本 质 。 
认 知 科学 是 研究 人 类 感知 、 学 习 、 记 忆 、 思 维 、 意 识 等 人 脑 心智 活动 过 程 的 科学 。 人 工 
智能 研究 用 人 工 的 方法 和 技术 模仿 、 延伸 和 扩展 人 的 智能 , 实现 机 器 智能 。 

(2) 互联 网 智能 。 互 联网 为 智能 科学 与 技术 提供 了 重要 的 研究 、 普 及 和 应 用 平台 。 
作为 知识 处 理 和 智能 行为 交互 的 基本 环境 , 今天 的 互联 网 络 最 丰富 的 就 是 信息 , 最 缺乏 
的 就 是 智能 。 如 何 为 在 海量 信息 面前 无 所 适 从 的 用 户 提 供 有 效 的 检索 手段 , 如 何 剔 除 
有 害 的 、 无 用 的 垃圾 邮件 , 如 何 使 远方 的 机 器 人 成 为 你 放心 的 智能 代理 , 都 对 网 络 信 息 
的 智能 化 提出 迫切 的 需求 , 也 是 智能 科学 与 技术 发 展 的 巨大 动力 。 基于 互联 网 的 集体 
智能 , 通过 大 规模 协作 、 综 合集 成 , 将 为 科学 决策 提供 有 效 的 途径 。 

(3) 智能 机 器 人 。 智能 机 器 人 是 将 体力 劳动 和 智力 劳动 高 度 结合 的 产物 。 智能 机 
器 人 是 一 种 具有 智能 的 、 高 度 灵活 性 的 、 自 动 化 的 机 器 , 具备 感知 、 规 划 、 动 作 、 协 同等 
能 力 , 是 多 种 高 新 技术 的 集成 体 。 




















12 人 工大 能 ( 荔 3 瞩 ) 


欧盟 委员 会 2011 年 5 月 评 出 了 对 未 来 影响 最 大 的 6 项 前 沿 技术 。 这 6 大 技术 目前 还 
处 于 研究 阶段 , 前 3 项 分 别 是 : 未 来 信息 分 析 模 拟 技术 、 石墨 烯 科技 和 纳米 级 传感器 技 
术 。 后 3 项 与 人 工 智 能 有 关 , 分 别 是 : 

“人 脑 工程 技术 ”。 这 一 技术 可 用 于 对 人 脑 的 低能 耗 、 高 效率 进行 研究 。 人 脑 的 学 
习 功 能 、 联 想 功 能 、 创 新 功能 都 是 目前 计算 机 不 具备 的 。 另外 , 具有 如 此 巨大 功能 的 人 
脑 又 是 节能 减 排 的 典范 , 它 的 功 耗 只 有 20~ 30W, 相当 于 一 荔 白 炽 灯 。 人 脑 的 这 些 神奇 之 
处 一 旦 被 破解 , 将 为 信息 技术 研发 提供 借鉴 。 

' 尾 学 信息 技术 " 。 有 关 研 究 旨 在 推动 信息 技术 在 医药 领域 的 大 规模 应 用 。 此 类 
技术 还 将 对 海量 传输 健康 信息 、 利 用 人 工 智 能 技术 处 理 这 些 信息 并 做 出 个 性 化 治疗 方案 
提出 新 要 求 。 

' 笠 侣 型 机 器 人 "开发 。 这 一 项 目 旨 在 研制 具有 一 定 感知 、 交 流 和 情感 表达 能 力 的 
仿真 机 器 人 , 为 人 类 (特别 是 小 孩 和 老人 ) 提供 无 微 不 至 的 服务 。 这 一 项 目 将 有 两 大 亮 
点 : 一 是 依靠 先进 的 人 工 智 能 技术 , 使 机 器 人 初步 具有 像 人 一 样 的 感知 、 交 流 和 情感 表 
达能 力 ; 二 是 开发 出 制造 机 器 人 的 新 材料 , 可 以 让 机 器 人 看 起 来 、 摸 起 来 像 真 人 一 样 。 

中 国 计 算 机 学 会 《技术 动态 ) 评 出 “2011 年 度 十 大 新 闻 ”, 其 中 3 条 与 人 工 智 能 有 
关 :  ' 脑 神经 元 连接 同步 定位 首 获 成 功 ” “TBM 成 功 构 建 模拟 人 脑 功能 的 认 知 计算 机 芯 
片 " 和 扶 研 发 光子 神经 元 系统 引 计算 机 速度 革命 ”。 

本 书 是 在 《人 工 智 能 》(2005 版 ) 的 基础 上 , 吸取 了 国内 外 人 工 智能 教材 的 优点 , 增 
补 了 国际 上 最 新 的 研究 成 果 修 订 而 成 。 参 考 史 忠 植 教授 的 教材 , 新 增 一 章 互联 网 智 
能 ”, 包括 语义 网 与 本 体 、Web 技 术 、Web 挖 掘 和 集体 智能 等 内 容 。 结合 教学 实际 ,以 附录 
形式 增加 了 “人 工 智 能 大 作业 ”, 包括 2 个 问题 ( 选 题 ) , 并 明确 了 大 作业 组 织 形式 及 
要 求 。 

本 书 第 3、4、9、10 章 由 张 疹 铎 撰写 , 其 余 各 章 由 奠 可 荣 撰写 。 全 书 由 责 可 荣 统 稿 。 
葵 敦 波 对 第 3 章 进行 了 修订 , 郑 笛 参 与 了 第 4 10 章 的 修订 , 陈 志 刚 教授 对 全 书 进行 了 认 
真 审 校 , 特此 致谢 。 

感谢 所 有 参考 文献 的 作者 , 感谢 "中国 计算 机 学 会 通讯 ”、 中 国 计 算 机 学 会 技术 动 
态 " 部 分 论文 的 作者 。 
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智能 (intelligence ) 是 人 类 所 特有 的 区 别 于 一 般 生 物 的 主要 特征 。 智能 
解释 为 感知、 学 习 、 理 解 、 知 道 的 能 力 , 思维 的 能 力 ”。 智能 通常 被 理解 
为 “人 认识 客观 事物 并 运用 知识 解决 实际 问题 的 能 力 …… 往往 通过 观察 、 记 
忆 、 想 象 、 思 维 、 判 断 等 表现 出 来 ”。 

人 工 智能 就 是 用 计算 机 模拟 人 的 智能 , 因此 又 叫 作 机 器 智能 。 研究 人 
工 智能 的 目的 , 一 方面 是 要 造 出 具有 智能 的 机 器 , 另 一 方面 是 要 弄 清 人 类 智 
能 的 本 质 。 通过 研究 和 开发 人 工 智能 , 可 以 辅助 、 部 分 代替 , 甚至 拓宽 人 的 
智能 , 使 计算 机 更 好 地 造福 于 人 类 。 

信息 经 抽象 结晶 为 知识 , 知识 构成 智能 的 基础 。 因此 , 信息 化 到 知识 
化 再 到 智能 化 , 必 将 成 为 人 类 社会 发 展 的 趋势 。 人 工 智 能 已 经 并 正在 广泛 
而 深入 地 结合 到 科学 技术 的 各 门 学 科 和 社会 的 各 个 领域 中 , 它 的 概念 、 方 法 
和 技术 正在 各 行 各 业 广泛 渗透 。 智能 已 成 为 当今 各 种 新 产品 、 新 装备 的 发 
展 方向 。 

随 着 人 工 智能 学 科 的 发 展 , 课程 的 内 容 也 要 不 断 更 新 。 在 美国 , 由 IEEE 
Computer Society 和 ACM 计算 教程 联合 工作 组 共同 制订 了 《计算 教程 2001》 
(Computing Qi 2001, 0C2001 ) ， 它 主要 修订 了 CC191, 以 反映 计算 机 领域 
十 余年 来 的 发 展 。 从 CC2001 可 以 看 出 , 人工 智能 课程 除 包括 人 工 智能 概 
论 、 问 题 状 态 与 搜索 、 知 识 表示 、 机 器 人 学 等 传统 部 分 外 , 还 增加 了 机 器 学 
习 、 智 能 体 、 自然 语言 处 理 、 语 音 处理 、 知 识 库 系统 、 神 经 网 络 、 遗 传 算法 等 
内 容 。 这 充分 反映 了 CC2001 对 人 工 智 能 课程 的 重视 。 在 我 国 , 从 20 世 纪 70 
年 代 末 开始 , 随 着 改革 开放 政策 的 实施 , 人工 智 能 的 教学 和 科研 逐步 展开 。 

本 书 介绍 人 工 智能 的 理论 、 方 法 和 技术 及 其 应 用 , 除了 讨论 那些 仍然 有 
用 的 和 有 效 的 基本 原理 和 方法 外 , 着 重 阐述 一 些 新 的 和 正在 研究 的 人 工 知 
能 方法 与 技术 , 特别 是 近期 发 展 起 来 的 方法 和 技术 。 此 外 , 用 比较 多 的 篇 
幅 论述 人 工 智 能 的 应 用 , 包括 人 工 智 能 新 的 应 用 研究 。 具体 包括 下 列 
内 容 。 

(1) 简 述 人 工 智 能 的 起 源 与 发 展 , 讨论 人 工 智 能 的 定义 、 人 工 智能 与 
计算 机 的 关系 以 及 人 工 智能 的 研究 和 应 用 领域 。 
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(2) 论述 知识 表示 、 推 理 和 不 确定 推理 的 主要 方法 , 包括 谓词 逻辑 、 产 生 式 系统 、 
语义 网 络 、 框 架 、 面向 对 象 、 归 结 推理 、 非 单调 推理 、 主 观 Bayes 方法 、 确 定性 理论 、 证 据 
理论 、 模 糊 逻 辑 和 模糊 推理 等 。 

(3) 讨论 常用 搜索 原理 , 如 盲目 搜索 、 启 发 式 搜 索 、minimax 搜索 、a- B 剪 枝 和 约束 
满足 等 , 并 研究 一 些 比较 高 级 的 搜索 技术 , 如 贪 禁 局 部 搜索 、 局 部 剪 枝 搜索 、 模拟 退火 
算法 、 遗 传 算法 等 。 

(4) 介绍 近期 发 展 起 来 的 已 成 为 当前 研究 热点 的 人 工 智能 技术 和 方法 , 即 分 布 式 人 
工 智能 与 Agent、 计算 智能 、 机 器 学 习 、 反 向 传播 神经 网 络 、Hopfield 神经 网 络 、 知 识 发 
现 等 。 

(5) 比较 详细 地 分 析 人 工 智能 的 主要 应 用 领域 , 涉及 自动 规划 系统 、 自 然 语言 处 
理 、 信 息 检索 、 语 言 翻 译 、 语音 识别 、 机 器 人 等 。 

本 书 第 3、4、9、10 章 由 张 彦 铎 撰写 , 其 余 各 章 由 奠 可 荣 撰写 。 全 书 由 责 可 荣 统 稿 。 
吴 荣华 撰写 了 附录 初稿 。 陈 志 刚 教授 对 全 书 进行 了 认真 审 校 , 特此 致谢 。 

在 本 书 编写 过 程 中 , 参考 和 引用 了 许多 专家 、 学 者 的 著作 和 论文 , 正文 中 未 一 一 注 
明 。 在 此 , 作者 谨 向 相关 参考 文献 的 作者 表示 衷心 的 感谢 。 

不 当 之 处 , 恳请 读者 批评 指正 。 


作 者 
2006 年 1 月 
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第 | 章 
绪论 


人 工 智 能 自 诞生 之 日 起 就 引起 人 们 无 限 美好 的 想象 和 尽 悍 ,已 经 成 为 学 
科 交 叉 发 展 中 的 一 攻 明 灯 , 光 芒 四 射 ,但 其 理论 起 伏 跌宕 ,也 存在 争议 和 
误解 。 

本 章 首先 介绍 人 工 智能 的 定义 、 发 展 概况 及 相关 学 派 及 其 认 知 观 ,接着 
讨论 人 工 智能 的 研究 和 应 用 领域 ,介绍 了 人 工 智能 鲁 棒 性 和 伦理 问题 ,综述 
了 人 工 智能 发 展 特征 、 待 解 问题 以 及 国家 人 工 智能 发 展 规划 。 


1.1 人 工 智能 的 定义 与 概况 


60 多 年 来 ,人 工 智能 取得 很 大 发 展 , 引 起 众多 学 科 和 不 同 专业 背景 学 者 
们 的 日 益 重 视 ,成 为 一 门 广泛 的 交叉 和 前 沿 科 学 。 计 算 机 技术 的 发 展 已 能 够 
存储 极其 大 量 的 信息 ,进行 快速 信息 处 理 , 软 件 功 能 和 硬件 实现 均 取 得 长 足 
进步 ,使 人 工 智能 获得 进一步 的 应 用 。 

人 类 智能 伴随 着 人 类 活动 时 时 处 处 存在 。 人 类 的 许多 活动 ,如 下 棋 、 竞 技 、 
解 题 .游戏 ,规划 和 编程 ,甚至 驾车 和 骑 车 都 需要 ”智能 "。 如 果 机 器 能 够 执行 这 
种 任务 ,就 可 以 认为 机 器 已 具有 某 种 性 质 的 "人工 智能 ”"。 不 同 科学 或 学 科 背 景 
的 学 者 对 人 工 智能 有 不 同 的 理解 ,先后 出 现 了 3 个 主流 学 派 : 逻辑 学 派 (符号 
主义 方法 )、 仿 生 学 派 (联结 主义 方法 ) 和 控制 论 学 派 (行为 主义 方法 ) 。 

1. 人 工 智能 的 定义 

人 工 智能 (Artificial Intelligence, AD) 是 研究 理解 和 模拟 人 类 智能 ,智能 
行为 及 其 规律 的 一 门 学 科 。 其 主要 任务 是 建立 智能 信息 处 理 理 论 ,进而 设计 
可 以 展现 某 些 近似 于 人 类 智能 行为 的 计算 系统 。 

下 面 是 部 分 学 者 对 人 工 智能 概念 的 描述 ,可 以 看 作 他 们 各 自 对 人 工 智 能 
所 下 的 定义 。 

(1) 人 工 智 能 是 那些 与 人 的 思维 相关 的 活动 ,诸如 决策 .问题 求解 和 学 
习 等 的 自动 化 (Bellman,1978 年 ) 。 

(2) 人 工 智能 是 一 种 计算 机 能 够 思维 ,使 机 器 具有 智力 的 激动 人 心 的 新 
尝试 (Haugeland,1985 年 )。 
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(3) 人 工 智 能 是 研究 如 何 让 计算 机 做 现 阶段 只 有 人 才能 做 得 好 的 事情 (Rich Knight， 
1991 年 ) 。 

(4) 人 工 智能 是 那些 使 知觉 .推理 和 行为 成 为 可 能 的 计算 的 研究 (Winston,1992 年 ) 。 

(5) 广义 地 讲 , 人 工 智能 是 关于 人 造物 的 智能 行为 ,而 智能 行为 包括 知觉 推理 学 
习 ,交流 和 在 复杂 环境 中 的 行为 (Nilsson,1998 年 ) 。 

(6) Stuart Russell 和 Peter Norvig 则 把 已 有 的 一 些 人 工 智 能 定义 分 为 4 类 : 像 人 一 
样 思考 的 系统 、 像 人 一 样 行动 的 系统 、 理 性 地 思考 的 系统 、 理 性 地 行动 的 系统 (2003 年 ) 。 

智能 机 器 (intelligent machine) 是 能 够 在 各 类 环境 中 自主 地 或 交互 地 执行 各 种 拟人 
任务 的 机 器 。 

人 工 智能 能 力 是 智能 机 器 所 执行 的 通常 与 人 类 智能 有 关 的 智能 行为 ,如 判断 、 推 理 、 
证 明 ,识别 ,感知 理解、 通信 ,设计 、 思 考 、 规 划 、 学 习 和 问题 求解 等 思维 活动 。 

2. 图 灵 测 试 

关于 如 何 界定 机 器 智能 , 早 在 人 工 智 能 学 科 还 未 正式 诞生 之 前 的 1950 年 ,计算 机 科 
学 创始 人 之 一 的 英国 数学 家 阿兰 。 图 灵 (Alan Turing) 就 提出 了 现 称 为 “图 灵 测 试 
(Turing Test) ”的 方法 。 简 单 地 讲 , 图 灵 测 试 的 做 法 是 : 让 一 位 测试 者 分 别 与 一 台 计 算 机 
和 一 个 人 进行 交谈 (当时 是 用 电 传 打字 机 ) ,而 测试 者 事先 并 不 知道 哪 一 个 被 测 者 是 人 , 哪 
一 个 是 计算 机 。 如 果 交 谈 后 测试 者 分 不 出 哪 一 个 被 测 者 是 人 , 哪 一 个 是 计算 机 , 则 可 以 认 
为 这 台 被 测 的 计算 机 具有 智能 。 

3. 人 工 智 能 的 起 源 

人 类 对 智能 问题 的 关注 和 探索 ,至少 可 以 追溯 到 2000 多 年 前 的 时 代 。 那 时 ,希腊 人 
和 中 国 先 人 都 把 * 心 "看 作 * 思 维 的 器 官 ”。 从 严格 的 科学 意义 上 说 ,智能 科学 技术 研究 的 
标志 性 进展 ,是 20 世纪 初 自然 智能 方面 的 Golgi 染色 法 和 Cajal 神经 元 学 说 以 及 20 世纪 
中 叶 人 工 智能 方面 的 人 工 神经 网 络 和 符号 逻辑 系统 理论 。 

20 世纪 30 年 代 , 数 理 逻 辑 学 家 Frege、Whitehead、Russell 和 Tarski 等 人 研究 表明 ， 
推理 的 某 些 方面 可 以 用 比较 简单 的 结构 加 以 形式 化 。Church .Turing 等 人 给 出 了 计算 的 
本 质 刻画 。 

1956 年 ,Dartmouth 会 议 标 志 人 工 智 能 学 科 的 诞生 , 它 从 一 开始 就 是 交叉 学 科 的 产 
物 。 与 会 者 有 数学 家 、 逮 辑 学 家 、 认 知 学 家 、 心 理学 家 、 神 经 生理 学 家 和 计算 机 科学 家 。 
Dartmouth 会 议 上 ,Marvin Minsky 的 神经 网 络 模拟 器 John McCarthy 的 搜索 法 ,以 及 
Herbert Simon 和 Allen Newell 的 定理 证 明 器 是 会 议 的 3 个 亮点 ,分 别 讨论 如 何 穿 过 迷 
富 , 如 何 搜索 推理 ,如 何 证 明 数 学 定理 。 会 上 首次 使 用 了 “人 工 智能 ”这 一 术语 。 这 些 学 者 
(还 包括 Lochester、Shannon、More、Samuel) 后 来 绝 大 多 数 都 成 为 著名 的 人 工 智 能 专家 。 

1969 年 召开 了 第 一 届 国 际 人 工 智 能 联合 会 议 (International Joint Conference on AI， 
JJCADI) ,此 后 每 两 年 召开 一 次 ;1970 年 ,杂志 International Journal of AT 创刊 。 这 些 对 
开展 人 工 智能 国际 学 术 活 动 和 交流 、 促 进入 工 智能 的 研究 与 发 展 起 到 积极 的 作用 。 
JJCAI2013 于 2013 年 8 月 3 日 至 9 日 首次 在 中 国 举办 。 

控制 论 思想 对 人 工 智 能 早期 研究 有 重要 影响 。Wiener、McCulloch 等 人 提出 的 控制 
论 和 自 组 织 系 统 的 概念 集中 讨论 了 “局 部 简单 ”系统 的 宏观 特性 。1948 年 , Wiener 发 表 
的 《动物 与 机 器 中 的 控制 与 通信 ) 论 文 不 但 开创 了 近代 控制 论 ,而 且 为 人 工 智 能 的 控制 论 
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学 派 ( 即 行为 主义 学 派 ) 树 立 了 新 的 里 程 碑 。 控 制 论 影响 了 许多 领域 ,因为 控制 论 的 概念 
跨 接 了 许多 领域 ,把 神经 系统 的 工作 原理 与 信息 理论 ,控制 理论 ,逻辑 以 及 计算 联系 起 来 。 

最 终 把 这 些 不 同 思想 连接 起 来 的 是 由 Babbage、Turing、von Neumann 和 其 他 一 些 人 
研制 的 计算 机 本 身 。 在 机 器 的 应 用 成 为 可 行 之 后 不 久 , 人 们 就 开始 试图 编写 程序 ,以 解决 
智力 测验 难题 下 棋 以 及 把 文本 从 一 种 语言 翻译 成 男 一 种 语言 。 这 是 第 一 批 人 工 智能 
程序 。 

4. 人 工 智能 的 发 展 

60 多 年 来 ,人 工 智能 的 应 用 研究 取得 了 重大 进展 。 首 先 ,专家 系统 (expert system) 
显示 出 强大 的 生命 力 。 被 誉 为 “专家 系统 和 知识 工程 之 父 ” 的 Feigenbaum 所 领导 的 研究 
小 组 于 1968 年 研究 成 功 第 一 个 专家 系统 DENDRAL, 用 于 质谱 仪 分 析 有 机 化 合 物 的 分 
子 结构 。1972 一 1976 年 ,Feigenbaum 小 组 又 开发 成 功 MYCIN 医疗 专家 系统 ,用 于 抗 生 
素 药 物 治疗 。 此 后 ,许多 著名 的 专家 系统 , 如 PROSPECTOR 地 质 勘 探 专家 系统 、 
CASNET 青光眼 诊断 治疗 专家 系统 、RI 计算 机 结构 设计 专家 系统 .MACSYMA 符号 积 
分 与 定理 证 明 专 家 系统 等 被 相继 开发 ,为 工矿 数据 分 析 处 理 . 医 疗 诊断 `. 计 算 机 设计 、 符 号 
运算 和 定理 证 明 等 提供 了 强 有 力 的 工具 。1977 年 ,Feigenbaum 进一步 提出 了 知识 工程 
(knowledge engineering) 的 概念 。 整 个 20 世纪 80 年 代 , 专 家 系统 和 知识 工程 在 全 世界 
得 到 迅速 发 展 。 在 开发 专家 系统 的 过 程 中 ,许多 研究 者 获得 共识 , 即 人 工 智 能 系统 是 一 个 
知识 处 理 系统 ,而 知识 表示 、 知 识 利用 和 知识 获取 则 成 为 人 工 智 能 系统 的 3 个 基本 问题 。 

互联 网 为 智能 科学 与 技术 提供 了 重要 的 研究 .普及 和 应 用 平台 。 作 为 知识 处 理 和 智 
能 行为 交互 的 基本 环境 ,今天 的 互联 网 络 最 丰富 的 就 是 信息 ,最 缺乏 的 就 是 智能 。 如 何 为 
在 海量 信息 面前 无 所 适 从 的 用 户 提供 有 效 的 检索 手段 ,如 何 剔 除 有 害 的 、 无 用 的 垃圾 邮 
件 , 如 何 使 远方 的 机 器 人 成 为 你 放心 的 智能 代理 ,都 对 网 络 信息 的 智能 化 提出 迫切 的 需 
求 ,也 是 智能 科学 与 技术 发 展 的 巨大 动力 。 基 于 互联 网 的 集体 智能 ,通过 大 规模 协作 、 综 
合集 成 ,将 为 科学 决策 提供 有 效 的 途径 。 

近 几 年 ,机 器 学 习 、 计 算 智 能 ,人工 神 经 网 络 等 行为 主义 的 研究 深入 开展 ,形成 高 潮 ， 
这 些 都 推动 了 人 工 智能 研究 的 深入 发 展 。 

图 灵 奖 (计算 机 科学 最 高 荣誉 ) 获 得 者 中 有 9 位 人 工 智能 学 者 ,分 别 是 Marvin 
Minsky(1969 年 获奖 ) John McCarthy(1971 年 获奖 )、Herbert Simon 和 Allen Newell 
(1975 年 获奖 )、Edward Albert Feigenbaum 和 Raj Reddy(1994 年 获奖 )、Leslie Valiant 
(2010 年 获奖 ) Judea Pearl(2011 年 获奖 ) Tim Berners-Lee(2016 年 获奖 ) 。 

出 生 于 英国 的 理论 计算 机 科学 家 、 哈 佛 大 学 教授 Leslie Valiant 因为 “对 众多 计算 理 
论 (包括 PAC 学 习 、 枚 举 复杂 性 、 代 数 计算 和 并 行 与 分 布 式 计算 ) 所 做 的 变革 性 的 贡献 ”而 
获得 2010 年 图 灵 奖 。Leslie Valiant 最 大 的 贡献 是 1984 年 的 论文 A Theory of ithe 
Learnable ,使 诞生 于 20 世纪 50 年 代 的 机 器 学 习 领 域 第 一 次 有 了 坚实 的 数学 基础 ,这 对 
人 工 智能 诸多 领域 (包括 加 强 学 习 、 机 器 视觉 .自然 语言 处 理 和 手写 识别 等 ) 都 产生 了 巨大 
影响 。 没 有 他 的 贡献 ,IBM 也 不 可 能 造 出 Watson 这 样 神奇 的 机 器 。2011 年 ,图 灵 奖 颁 
发 给 了 加 州 大 学 洛杉矶 分 校 (UCLA) 的 Judea Pearl 教授 ,奖励 他 在 人 工 智能 领域 的 基础 
性 贡献 ,他 提出 概率 和 因果 性 推理 演算 法 ,彻底 改变 了 人 工 智 能 最 初 基于 规则 和 逮 辑 的 
方向 。 
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Tim Berners-Lee 作为 万 维 网 (World Wide Web, WWW) 的 发 明 人 获得 2016 年 的 图 
灵 奖 。 但 他 的 贡献 并 不 止 于 Web。 在 过 去 近 30 年 的 工作 里 ,他 的 贡献 大 体 可 分 为 3 个 
阶段 : 第 一 阶段 为 1989 一 1999 年 ,他 的 主要 精力 在 Web 本 身 的 发 明和 推广 上 ,贡献 是 互 
联 的 文档 ;第 二 阶段 为 1999 一 2009 年 ,他 主要 推广 语义 网 ,贡献 是 互联 的 知识 ;第 三 阶段 
是 2009 年 至 今 , 他 主要 致力 于 数据 的 开放 、 安 全 和 隐私 ,贡献 是 互联 的 社会 。Tim 是 美国 
科学 院 院士 ,英国 皇家 学 会 院士 。 本 书 第 11 章 “ 互 联网 智能 ”详细 介绍 了 Web 技术 。 

人 工 智能 有 3 次 大 跃进 。 第 一 次 是 智能 系统 代 蔡 人 完成 部 分 逻辑 推理 工作 ,如 机 器 
定理 证 明和 专家 系统 。 第 二 次 是 智能 系统 能 够 和 环境 交互 ,从 运行 的 环境 中 获取 信息 , 代 
替 人 完成 包括 不 确定 性 在 内 的 部 分 思维 工作 ,通过 自身 的 动作 ,对 环境 施加 影响 ,并 适应 
环境 的 变化 ,如 智能 机 器 人 。 第 三 次 是 智能 系统 具有 人 类 的 认 知 和 思维 能 力 ,能 够 发 现 新 
的 知识 ,完成 面临 的 任务 ,如 基于 数据 挖掘 的 系统 。 

中 国 的 人 工 智 能 研究 起 步 较 晚 。 纳 入 国家 计划 的 研究 (“ 智 能 模拟 ”7 开始 于 1978 年 ; 
1984 年 召开 了 智能 计算 机 及 其 系统 的 全 国学 术 讨 论 会 ;1986 年 起 把 智能 计算 机 系统 、 智 
能 机 器 人 和 智能 信息 处 理 ( 含 模式 识别 ) 等 重大 项 目 列 入 国家 高 技术 研究 计划 ;1993 年 
起 ,又 把 智能 控制 和 智能 自动 化 等 项 目 列 入 国家 科技 攀登 计划 。 进 入 21 世纪 后 ,已 有 更 
多 的 人 工 智能 与 智能 系统 研究 获得 各 种 基金 计划 支持 。1981 年 起 ,相继 成 立 了 中 国人 工 
智能 学 会 (CAAD 全国 高 校 人 工 智 能 研究 会 .中 国 计 算 机 学 会 人 工 智 能 与 模式 识别 专业 
委员 会 .中 国 自 动 化 学 会 模式 识别 与 机 器 智能 专业 委员 会 .中 国 软件 行业 协会 人 工 智 能 协 
会 .中 国 智能 机 器 人 专业 委员 会 .中 国 计 算 机 视觉 与 智能 控制 专业 委员 会 以 及 中 国 智能 自 
动 化 专业 委员 会 等 学 术 团 体 。1989 年 首次 召开 了 中 国人 工 智 能 联合 会 议 (CJCAI) 。 
1987 年 ,杂志 《模式 识别 与 人 工 智 能 ?创刊 。 中 国 科 学 家 在 人 工 智 能 领域 取得 一 些 在 国际 
上 有 影响 的 创造 性 成 果 ,如 吴 文 俊 院士 关于 几何 定理 证 明 的 “ 吴 氏 方法 ”。 

2006 年 在 北京 召开 了 “2006 人 工 智能 国际 会 议 ”, 系 统 总 结 了 50 年 来 人 工 智 能 发 展 
的 成 就 和 问题 ,探讨 了 未 来 研究 的 方向 。 会 议 期 间 , 中 国人 工 智能 学 会 提出 了 以 高 等 智能 
为 标志 的 研究 理念 和 纲领 。 高 等 智能 的 理念 认为 : 结构 ,功能 ,行为 是 研究 智能 的 重要 
侧面 ,但 更 具 本 质 意义 的 研究 途径 是 “智能 生成 的 共性 核心 机 制 ”( 探 索 智 能 生成 机 制 的 研 
究 方法 称 为 人 工 智 能 的 “机 制 主义 ?方法 ); @ 机 制 主 义 方法 的 技术 实现 是 信息 一 知识 一 
智能 转换 ; @@ 通 过 机 制 主义 方法 ,应 当 可 以 把 人 工 智能 的 结构 主义 、 功 能 主义 ,行为 主义 
方法 有 机 和 谐 统 一 起 来 ; @ 通 过 机 制 主义 研究 方法 可 以 发 现 和 沟通 意识 、 情 感 , 智 能 的 内 
在 联系 ,从 而 可 以 打通 人 工 智能 与 自然 智能 之 间 的 壁垒 。 近 年 来 ,智能 科技 工作 者 开始 把 
研究 目光 投向 国民 经 济 ( 如 节能 减 排 . 气 候 变 化 ) 、 社 会 文明 (如 绿色 与 安全 网 络 ) 和 国防 安 
全 (如 智能 战争 ) 领 域 的 重大 应 用 上 .正在 努力 把 智能 科学 技术 的 研究 从 机 器 博弈 一 类 的 
“游戏 世界 ”转变 到 解决 “现实 世界 ”重大 问题 的 轨道 上 。 

2017 年 7 月 ,国务 院 颁 发 了 (新 一 代 人 工 智 能 发 展 规划 》, 重 点 任务 包括 : 构建 开放 协 
同 的 人 工 智能 科技 创新 体系 ;培育 高 端 高 效 的 智能 经 济 ; 建 设 安 全 便捷 的 智能 社会 ;加 强 
人 工 智能 领域 军民 融合 ;构建 泛 在 安全 高 效 的 智能 化 基础 设施 体系 ;前 瞻 布 局 新 一 代 人 工 
智能 重大 科技 项 目 。 

5. AI 解放 人 力 最 终 服务 于 人 

最 近 几 年 AI 技术 的 突破 ,其 应 用 普遍 聚焦 在 3 个 方面 : 人 机 交互 的 变革 , 即 让 AI 看 
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得 懂 、 听 得 懂 ; 场 景 应 对 与 决策 的 自动 化 ,如 自动 驾驶 和 医疗 图 像 的 智能 诊断 等 ;解决 系统 
优化 问题 的 大 数据 ,如 电网 调度 ,物流 和 仓储 等 资源 与 效率 的 优化 。 

人 机 交互 的 变革 可 以 说 是 人 工 智 能 这 几 年 突破 的 一 个 重要 领域 。 计 算 机 技术 的 发 
展 ,每 隔 20 年 左右 就 会 出 现 一 次 人 机 交互 的 重大 变革 ,我 们 现在 已 经 到 了 第 三 次 人 机 交 
互 改 革 的 时 代 。 在 PC 时 代 , 人 们 与 机 器 通过 键盘 和 鼠标 交流 ;在 移动 互联 网 时 代 , 人 们 
与 智能 手机 通过 手指 操控 屏幕 交流 ;在 智能 时 代 , 人 们 与 机 器 之 间 是 通过 机 器 视觉 和 语音 
技术 进行 交互 的 。 

在 场景 应 对 与 决策 方面 ,自动 驾驶 是 一 个 很 好 的 例子 。 自 动 驾驶 系统 通过 车 上 摄像 
头 进行 路 况 识别 ,控制 方向 盘 的 操作 与 行车 速度 ,能 比 一 般 人 更 可 靠 地 应 对 路 上 的 突 发 事 
件 。 又 如 ,在 医疗 场景 ,不 同 经 验 的 医生 有 时 候 意见 会 不 一 致 ,如 果 通 过 人 工 智 能 的 训练 ， 
诊断 可 以 变 得 更 可 靠 、 更 准确 ,让 医疗 水 平 上 升 到 一 个 更 高 的 水 平 。 

大 数据 应 用 在 很 多 工业 领域 (如 电网 调度 、 物 流 和 仓储 优化 等 方面 ) 都 是 利用 大 数据 
在 最 优化 问题 中 找到 最 理想 的 解决 方案 。 我 们 平时 在 智能 手机 上 用 到 的 软件 产品 (如 机 
器 视觉 应 用 、 语 音 音频 应 用 、 个 性 化 内 容 推 荐 .游戏 AD 都 应 用 了 不 同类 型 的 ` 先 进 的 人 工 
智能 技术 。 


1.2 人 类 智能 与 人 工 智能 


在 自然 智能 (人 类 智能 ) 研 究 方面 ,人 们 主要 沿 着 "认识 脑 一 保护 脑 一 修复 脑 一 开发 脑 ” 
方向 展开 研究 ;但 是 ,基础 的 工作 集中 在 “认识 脑 ?方面 ,包括 认识 脑 的 结构 和 理解 脑 的 功能 。 
最 初 ,人 们 主要 通过 医学 解剖 观察 脑 的 生理 组 织 构造 。 后 来 发 明了 显微镜 ,可 以 对 脑 的 解剖 
结构 进行 更 细致 的 观察 。 进 一 步 的 发 展 又 发 现 了 染色 法 ,造影 术 、 示 踪 术 、 脑 电 技术 ,可 以 更 
具体 地 观察 和 显示 脑 内 神经 系统 的 组 织 结构 ;分 子 生物 学 的 发 展 使 人 们 对 脑 的 研究 可 以 从 
器 官 组织 深 入 到 分 子 层级 。 特 别 是 近 几 十 年 迅速 发 展 起 来 的 正 电子 发 射 断层 扫描 技术 
(PET) 和 功能 核磁 共振 成 像 技 术 (f-MRD ,使 人 们 可 以 在 无 创伤 的 条 件 下 了 解 脑 的 组 织 结 
和 相应 组 织 结构 的 基本 功能 ,观察 在 一 定 思维 状态 下 究竟 哪些 脑 组 织 参与 活动 。 同 时 ,研究 
还 发 现 了 脑 的 工作 既 有 分 区 的 特点 ,又 有 并 行 工 作 的 特点 ,以 此 保障 了 脑 的 工作 的 高 度 灵活 
性 与 高 度 生存 力 。 具 有 特别 重大 意义 的 是 ,人 们 发 现 了 脑 内 “ 古 皮层 一 旧 皮 层 一 新 皮层 ” 结 
构 和 功能 的 进化 规律 ,这 对 人 们 认识 脑 和 模拟 脑 具 有 巨大 的 启发 作用 。 

但 是 ,鉴于 脑 的 高 度 复杂 性 和 研究 手段 的 相对 不 完善 性 ,目前 人 们 对 脑 的 认识 还 处 在 
相对 初步 的 阶段 。 迄 今 , 对 脑 与 认 知 科学 研究 的 基本 问题 一 一 脑 结 构 的 认 知 机 理 ? 仍 然 
无 法 给 出 明确 的 回答 。 这 是 自然 智能 研究 面临 的 一 个 巨大 挑战 ,也 是 一 个 今后 研究 的 巨 
大 创新 空间 。 

在 人 工 智能 研究 方面 ,人 们 一 直 沿 着 模拟 脑 方向 做 出 努力 。 由 于 智能 问题 高 度 复杂 ， 
人 们 一 时 难以 总 揽 智 能 系统 的 全 局 ;于 是 便 按 照 传 统 的 科学 理念 ,分 别 从 智能 系统 的 结 
构 、 功 能 、 行 为 3 个 基本 侧面 展开 对 智能 的 研究 。 这 样 , 便 先 后 形成 了 模拟 大 脑 结 构 的 结 
构 主 义 方法 、 模 拟 大 脑 逻 辑 思维 功能 的 功能 主义 方法 以 及 模拟 智能 系统 行为 的 行为 主义 
方法 ,相应 地 建立 了 人 工 智能 的 3 种 重要 学 说 : 人 工 神经 网 络 学 说 ,符号 逻辑 人 工 智能 学 
说 以 及 感知 一 动作 系统 学 说 。 
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人 类 的 认 知 过 程 是 一 个 非常 复杂 的 行为 ,人 们 从 不 同 的 角度 对 它 进行 研究 ,从 而 形成 
诸如 认 知 生理 学 、 认 知心 理学 和 认 知 工程 学 等 相关 学 科 。 这 里 仅 讨论 几 个 与 人 工 智能 有 
密切 关系 的 问题 。 


1.2.1 智能 信息 处 理 系统 的 假设 


人 的 心理 活动 具有 不 同 的 层次 , 它 可 与 计算 机 的 层次 相 比较 。 心 理 活 动 的 最 高 层 是 
思维 策略 ,中 间 一 层 是 初级 信息 处 理 ,最 低层 为 生理 过 程 , 即 中 枢 神 经 系统 、 神 经 元 和 大 脑 
的 活动 。 与 此 相应 的 是 计算 机 的 程序 .语言 和 硬件 。 

研究 认 知 过 程 的 主要 任务 是 探求 高 层次 思维 决策 与 初级 信息 处 理 的 关系 ,并 用 计算 
机 程序 模拟 人 的 思维 策略 水 平 ,而 用 计算 机 语言 模拟 人 的 初级 信息 处 理 过 程 。 

计算 机 也 以 类 似 的 原理 进行 工作 。 在 规定 时 间 内 ,计算 机 存储 的 记忆 相当 于 机 体 的 
状态 ;计算 机 的 输入 相当 于 机 体 施 加 的 某 种 刺激 。 在 得 到 输入 之 后 ,计算 机 便 进 行 操 作 ， 
使 得 其 内 部 状态 随时 间 发 生变 化 。 可 以 从 不 同 的 层次 研究 这 种 计算 机 系统 。 这 种 系统 以 
人 的 思维 方式 为 模型 进行 智能 信息 处 理 。 显 然 , 这 是 一 种 智能 计算 机 系统 。 设 计 适用 于 
特定 领域 的 这 种 高 水 平 智能 信息 处 理 系 统 , 是 研究 认 知 过 程 的 一 个 具体 而 又 重要 的 目标 。 
例如 ,一 个 具有 智能 信息 处 理 能 力 的 自动 控制 系统 就 是 一 个 智能 控制 系统 , 它 可 以 是 专家 
控制 系统 ,或 者 是 智能 决策 系统 等 。 

可 以 把 人 看 作 一 个 智能 信息 处 理 系统 。 

信息 处 理 系统 也 称 符号 操作 系统 (symbol operation system ) 或 物理 符号 系统 
(physical symbol system) 。 符 号 就 是 模式 (pattern) 。 任 一 模式 ,只 要 它 能 与 其 他 模式 相 
区 别 ,就 是 一 个 符号 。 例 如 ,不 同 的 汉语 拼音 字母 或 英文 字母 就 是 不 同 的 符号 。 对 符号 进 
行 操 作 就 是 对 符号 进行 比较 ,从 中 找 出 相同 的 和 不 同 的 符号 。 物 理 符号 系统 的 基本 任务 
和 功能 就 是 辨认 相同 的 符号 和 区 别 不 同 的 符号 。 为 此 ,这 种 系统 就 必须 能 够 辨别 出 不 同 
符号 之 间 的 实质 差别 。 符 号 既 可 以 是 物理 符号 ,也 可 以 是 头脑 中 的 抽象 符号 ,或 者 是 电子 
计算 机 中 的 电子 运动 模式 ,还 可 以 是 头脑 中 神经 元 的 某 些 运动 方式 。 一 个 完善 的 符号 系 
统 应 具有 下 列 6 种 功能 。 

(1) 输入 (input) 符 号 。 

(2) 输出 (output) 符 号 。 

(3) 存储 (store) 符 号 。 

(4) 复制 (copy) 符 号 。 

(5) 建立 符号 结构 : 通过 找 出 各 符号 间 的 关系 ,在 符号 系统 中 形成 符号 结构 。 

(6) 条 件 性 迁移 (conditional transfer) : 根据 已 有 符号 ,继续 完成 活动 过 程 。 

如 果 一 个 物理 符号 系统 具有 上 述 6 种 功能 .能 够 完成 这 个 全 过 程 ,那么 它 就 是 一 个 完 
整 的 物理 符号 系统 。 人 能 够 输入 信号 ,如 用 眼睛 看 、 用 耳 人 打听 、 用 手 触 摸 等 。 计 算 机 也 能 
通过 磁盘 或 键盘 等 方式 输入 符号 。 人 具有 上 述 6 种 功能 ,现代 计算 机 也 具备 物理 符号 系 
统 的 这 6 种 功能 。 

假设 “任何 一 个 系统 ,如 果 它 能 够 表现 出 智能 ,那么 它 就 必定 能 够 执行 上 述 6 种 功 
能 。 反 之 ,任何 系统 如 果 具 有 这 6 种 功能 ,那么 它 就 能 够 表现 出 智能 ;这 种 智能 指 的 是 人 
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类 所 具有 的 那 种 智能 。 通 常 把 这 个 假设 称 为 物理 符号 系统 的 假设 。 

物理 符号 系统 的 假设 伴随 3 个 推论 ,或 称 为 附带 条 件 。 

推论 1.1 既然 人 具有 智能 ,那么 他 就 一 定 是 一 个 物理 符号 系统 。 人 之 所 以 能 够 表 
现 出 智能 ,就 是 基于 他 的 信息 处 理 过 程 。 

推论 1.2 既然 计算 机 是 一 个 物理 符号 系统 , 它 就 一 定 能 够 表现 出 智能 。 这 是 人 工 
智能 的 基本 条 件 。 

推论 1.3 既然 人 是 一 个 物理 符号 系统 ,计算 机 也 是 一 个 物理 符号 系统 ,那么 就 能 够 
用 计算 机 模拟 人 的 活动 。 

值得 指出 的 是 ,推论 1. 3 并 不 一 定 是 从 推论 1. 1 和 推论 1. 2 推导 出 来 的 必然 结果 。 
因为 人 是 一 个 物理 符号 系统 ,具有 智能 ;计算 机 也 是 一 个 物理 符号 系统 ,也 具有 智能 ,但 它 
们 可 以 用 不 同 的 原理 和 方式 进行 活动 。 所 以 ,计算 机 并 不 总 是 模拟 人 的 活动 , 它 可 以 编制 
出 一 些 复杂 的 程序 求解 方程 ,进行 复杂 的 计算 。 不 过 ,计算 机 的 这 种 运算 过 程 未 必 就 是 人 
类 的 思维 过 程 。 

可 以 按照 人 类 的 思维 过 程 编制 计算 机 程序 ,这 项 工作 就 是 人 工 智能 的 研究 内 容 。 如 
果 做 到 了 这 一 点 ,就 可 以 用 计算 机 在 形式 上 描述 人 的 思维 活动 过 程 ,或 者 建立 一 个 理论 说 
明 人 的 智力 活动 过 程 。 

人 的 认 知 活动 具有 不 同 的 层次 ,对 认 知 行为 的 研究 也 应 具有 不 同 的 层次 ,以便 不 同学 
科 之 间 的 分 工 协作 ,联合 攻关 ,早日 解 开 人 类 认 知 本 质 之 谜 。 可 以 从 下 列 4 个 层次 开展 对 
认 知 本 质 的 研究 。 

(1) 认 知 生理 学 : 研究 认 知行 为 的 生理 过 程 ,主要 研究 人 的 神经 系统 (神经 元 ,中 枢 
神经 系统 和 大 脑 ) 的 活动 ,是 认 知 科学 研究 的 底层 。 它 与 心理 学 、 神 经 学 、 脑 科学 有 着 密切 
的 关系 , 且 与 基因 学 .遗传 学 等 有 交叉 联系 。 

(2) 认 知 心理 学 : 研究 认 知行 为 的 心理 活动 ,主要 研究 人 的 思维 策略 ,是 认 知 科学 研 
究 的 顶层 。 它 与 心理 学 有 着 密切 的 关系 , 且 与 人 类 学 .语言 学 交叉 。 

(3) 认 知 信息 学 : 研究 人 的 认 知 行为 在 人 体内 的 初级 信息 处 理 , 主 要 研究 人 的 认 知 
行为 如 何 通 过 初级 信息 自然 处 理 , 由 生理 活动 变 为 心理 活动 及 其 逆 过 程 , 即 由 心理 活动 变 
为 生理 行为 。 这 是 认 知 活动 的 中 间 层 ,承上启下 。 它 与 神经 学 \ 信 息 学 、 计 算 机 科学 有 着 
密切 的 关系 ,并 与 心理 学 .生理 学 有 交叉 关系 。 

(4) 认 知 工程 学 : 研究 认 知 行为 的 信息 加 工 处 理 ,主要 研究 如 何 通过 以 计算 机 为 中 
心 的 人 工 信 息 处 理 系统 ,对 人 的 各 种 认 知 行为 (如 知觉 思维 、 记 忆 , 语 言 、 学 习 、 理 解 , 推 
理 , 识 别 等 ) 进 行 信息 处 理 。 这 是 研究 认 知 科学 和 认 知 行为 的 工具 ,应 成 为 现代 认 知 心理 
学 和 现代 认 知 生理 学 的 重要 研究 手段 。 它 与 人 工 智能 、 信 息 学 .计算 机 科学 有 着 密切 的 关 
系 ,并 与 控制 论 .系统 学 等 交叉 。 

只 有 开展 大 跨度 的 多 层次 ,多 学 科 交 又 研究 ,应 用 现代 智能 信息 处 理 的 最 新 手段 , 认 
知 科学 才 可 能 较 快 地 取得 突破 性 成 果 。 


1.2.2 人 类 智能 的 计算 机 模拟 


Pamela McCorduck 在 (机 器 思维 (Machines Who Think ,1979) 中 指出 : 在 复杂 的 机 
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械 装置 与 智能 之 间 存 在 着 长 期 的 联系 。 从 几 个 世纪 前 出 现 的 神话 般 的 复杂 巨 钟 和 机 械 自 
动机 开始 ,人 们 已 对 机 器 操作 的 复杂 性 与 自身 的 智能 活动 进行 直接 联系 。 今 天 ,新 技术 已 
使 所 建造 的 机 器 的 复杂 性 大 为 提高 。 现 代 电 子 计 算 机 要 比 以 往 的 任何 机 器 都 复杂 。 

计算 机 的 早期 工作 主要 集中 在 数值 计算 方面 。 然 而 ,人 类 最 主要 的 智力 活动 并 不 是 
数值 计算 ,而 是 在 逻辑 推理 方面 。 物 理 符号 系统 假设 的 推论 1. 1 也 告诉 人 们 ,人 有 智能 ， 
所 以 是 一 个 物理 符号 系统 ;推论 1.3 指出 ,可 以 编写 计算 机 程序 模拟 人 类 的 思维 活动 。 这 
就 是 说 ,人 和 计算 机 这 两 个 物理 符号 系统 所 使 用 的 物理 符号 是 相同 的 ,因而 计算 机 可 以 模 
拟人 类 的 智能 活动 过 程 。 计 算 机 的 确 能 够 很 好 地 执行 许多 智能 功能 ,如 下 棋 \、 证 明定 理 、 
翻译 语言 文字 和 解决 难题 等 。 这 些 任 务 是 通过 编写 与 执行 模拟 人 类 智能 的 计算 机 程序 完 
成 的 。 当 然 , 这 些 程序 只 能 接近 于 人 的 行为 ,而 不 可 能 与 人 的 行为 完全 相同 。 此 外 ,这 些 
程序 所 能 模拟 的 智能 问题 ,其 水 平 还 是 很 有 限 的 。 

下 面 考 虑 下 棋 的 计算 机 程序 。 计 算 机 程序 对 每 个 可 能 的 走 步 空间 进行 搜索 , 它 能 够 
同时 搜索 几 千 种 走 步 。 进 行 有 效 搜索 的 技术 是 人 工 智 能 的 核心 思想 之 一 。 不 过 ,以 前 的 
计算 机 不 能 战胜 最 好 的 人 类 棋 手 ,其 原因 在 于 : 向 前 看 并 不 是 下 棋 所 必须 具有 的 一 切 , 需 
要 彻底 搜索 的 走 步 又 太 多 ;在 寻找 和 估计 蔡 换 走 步 时 并 不 能 确信 能 够 导致 博弈 的 胜利 。 
当 象棋 大 师 们 盯 着 一 个 棋 位 时 ,在 他 们 的 脑子 里 出 现 了 很 多 盘 重 要 的 棋局 ,帮助 他 们 决定 
最 好 的 走 步 。 

近年 来 ,自学 习 、 并 行 处 理 、 启 发 式 搜索 、 机 器 学 习 、 智 能 决策 等 人 工 智能 技术 已 用 于 
博弈 程序 设计 ,使 “计算 机 棋 手 ”的 水 平 大 为 提高 。1997 年 5 月 ,IBM 公司 研制 的 深蓝 
(Deep Blue) 智 能 计算 机 在 6 局 比赛 中 以 2 胜 1 负 3 平 的 结果 战胜 国际 象棋 冠军 卡 斯 帕 
罗 夫 (Kasparov) ,深蓝 ?计算 速度 为 200 万 棋 步 / 秒 , 采 用 启发 式 搜索 方 法 。2003 年 1 月 
26 日 至 2 月 7 日 ,国际 象棋 人 机 大 战 在 纽约 举行 。Kasparoyv 与 比 * 深 蓝 ? 更 强大 的 “小 深 ” 
(Deep Junior) 先 后 进行 了 6 局 比赛 ,以 1 胜 1 负 4 平 的 结果 握手 言 和 。 

“深蓝 ?共有 30 个 处 理 器 ,每 个 处 理 器 的 速度 是 120MHz, 可 以 进行 平行 运算 。 它 还 
有 480 个 专门 的 下 棋 芯 片 。 它 的 下 棋 程 序 是 用 C 语言 写 的 ,每 秒 可 以 评估 2 亿 个 可 能 的 
双方 布局 一 一 比 1996 年 的 版 本 快 了 一 倍 。“ 深 蓝 ? 可 以 预先 计算 出 未 来 6 一 8 步 , 最 多 可 
以 计算 出 未 来 的 20 步 。 

“深蓝 ?出 神 人 化 的 棋艺 的 基础 是 “评估 功能 .也 就 是 评估 每 一 种 可 能 走 法 的 利 整 。 
另外 ,还 有 一 个 “残局 数据库, 里面 有 很 多 六 子 残局 和 五 子 残 局 。 而 且 , 深 蓝 ” 的 背后 还 
有 一 个 人 类 棋 手 参谋 团队 ,由 国际 象棋 大 师 乔 约 尔 。 本杰明 等 人 组 成 的 团队 帮助 完善 了 
程序 。 

《科技 日 报 》 在 *IBM 人 机 大 战 : 超级 电脑 让 人 类 智慧 处 于 危险 边缘 ?一 文中 报道 ,2011 
年 2 月 17 日 , 麻 战 三 回合 的 人 机 大 战 硝烟 散 尽 ,IBM 超级 电脑 沃 森 (Watson) 完 胜 鸣 金 。 

2011 年 2 月 14 一 16 日 ,IBM 沃 森 参 加 了 美国 智力 竞赛 "危险 边缘 (Jeopardy)” 的 电 
视 节目 。 这 个 节目 在 1964 年 创立 ,竞赛 问题 涉及 地 理 政治 .历史 、 体 育 、 娱 乐 等 。 参 加 这 
个 节目 首先 要 通过 难度 相当 大 的 考试 后 才能 获得 参赛 资格 。 比 赛 中 ,计算 机 沃 森 未 连接 
到 互联 网 ,而 是 借 由 高 速 多 重 运算 和 对 自己 算出 答案 的 “信心 ”判断 作答 。 两 名 对 手 肯 。 
詹 宁 斯 和 布 拉 德 . 鲁 特 尔 , 前 者 是 曾 连 赢 74 场 的 答题 王 .创下 连 赢 场 数 最 多 的 纪录 ;后 者 
是 获得 奖金 总 额 最 高 选手 ,总 数 达 325 万 美元 之 多 。 在 比赛 的 三 天 里 ,计算 机 沃 森 保持 着 
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优势 ,直到 最 末 一 轮 。 

IBM 沃 森 系 统 是 2006 年 开始 设计 的 。 机 器 是 由 90 台 IBM 750 服务 器 组 成 的 群集 
系统 ,每 台 服 务 器 都 采用 Power 7 处 理 器 。 它 是 8 核 芯片 ,每 核 有 4 个 线程 ,相当 于 有 
2880 个 核 在 运行 。 内 存 是 16TB 的 RAM。 采用 的 软件 有 SUSE Linux Enterprise Server 
11 操作 系统 .IBM DeepQA 软件 .Apache UIMA( 非 结构 化 信息 管理 体系 结构 ) 框 架 等 。 
该 系统 使 用 上 百 种 技术 分 析 自 然 语言 .识别 资源 ,寻找 并 产生 假设 、 寻 找 证 据 并 评分 、 对 假 
设 进行 聚集 和 分 级 ,因此 它 是 专门 设计 的 ,具有 学 习 能 力 的 机 器 。 

这 个 以 IBM 创始 人 托马斯 。J. 沃 森 的 名 字 命 名 的 系统 能 储存 大 量 信息 ,相当 于 “100 
万 本 书籍 和 2 亿 页 资料 ”, 还 可 以 从 经 验 中 学 习 如 何 提 高 性 能 ,并 且 使 用 自然 语言 回答 问 
题 。 世 界 各 地 的 研究 人 员 历 时 四 年 共同 完成 了 这 个 系统 ,其 中 也 有 中 国 的 科学 家 为 此 做 
出 了 贡献 。 该 系统 应 用 前 景 广泛 ,可 以 高 速 分 析 大 量 数据 ,用 来 帮助 政府 部 门 解答 公众 疑 
问 ,帮助 医生 评估 药物 疗效 。 

2016 年 3 月 ,人 工 智 能 围棋 AlphaGo 与 韩国 棋 手 李 世 石 进行 较量 ,最 终 人 机 大 战 总 
比分 为 1 : 4, 李 世 石 不 敌 AlphaGo。2017 年 5 月 ,中 国 棋 手 柯 洁 九 段 ( 世 界 围棋 等 级 分 第 
一 ) 与 人 工 智能 围棋 AlphaGo 进行 了 三 番 围 棋 大 战 ,最 终 柯 洁 以 0: 3 惨败 于 AlphaGo。 
2017 年 10 月 19 日 ,谷歌 旗下 人 工 智 能 公司 DeepMind 在 《自然 )(Nature) 上 发 表 论文 
称 ,最 新 版 本 的 AlphaGo Zero 完全 抛弃 了 人 类 棋谱 ,实现 了 从 零 开始 学 习 。 

AlphaGo Zero 与 AlphaGo( 在 此 表示 以 前 的 版 本 ) 的 主要 差别 是 : 

(1) 在 训练 中 不 再 依靠 人 类 棋谱 。AlphaGo 先 用 人 类 棋谱 进行 训练 ,然后 再 通过 自 
我 互 搏 的 方法 自我 提高 。AlphaGo Zero 直接 采用 自我 互 搏 的 方式 进行 学 习 , 在 蒙特 卡 洛 


(2) 不 再 使 用 人 工 设 计 的 特征 作为 输入 。 在 AlphaGo 中 ,输入 的 是 经 过 人 工 设计 的 
特征 ,根据 该 点 及 其 周围 的 棋 的 类 型 ( 黑 棋 、 白 棋 、 空 白 等 ) 组 成 不 同 的 输入 模式 ,确定 每 个 
落 子 位 置 。AlphaGo Zero 则 直接 把 棋盘 上 的 黑白 棋 作 为 输入 。 这 一 点 得 益 于 其 神经 网 
络 结构 的 变化 ,神经 网 络 层 数 越 深 ,提取 特征 的 能 力 越 强 。 

(3) 将 策略 网 络 和 价值 网 络 合 二 为 一 。 在 AlphaGo 中 ,使 用 的 策略 网 络 和 价值 网 络 
是 分 开 训练 的 ,但 是 两 个 网 络 的 大 部 分 结构 是 一 样 的 ,只 是 输出 不 同 。AlphaGo Zero 将 
这 两 个 网 络 合并 为 一 个 ,从 输入 层 到 中 间 几 层 是 共用 的 ,只 是 后 边 几 层 到 输出 层 是 分 开 
的 ,并 在 损失 函数 中 同时 考虑 了 策略 和 价值 两 个 部 分 。 这 样 训练 起 来 速度 会 更 快 。 

(4) 网 络 结构 采用 残 差 网 络 ,网 络 深度 更 深 。AlphaGo Zero 在 特征 提取 层 采用 了 多 
个 残 差 模块 ,每 个 模块 包含 2 个 卷 积 层 , 比 之 前 用 12 个 卷 积 层 的 AlphaGo 深度 明显 增 
加 ,从 而 可 以 实现 更 好 的 特征 提取 。 

(5) 不 再 使 用 随机 模拟 。 在 AlphaGo 中 ,蒙特 卡 洛 树 搜索 的 过 程 中 ,要 采用 随机 模 
拟 的 方法 计算 棋局 的 胜率 ,而 在 AlphaGo Zero 中 ,不 再 使 用 随机 模拟 的 方法 ,完全 依靠 神 
经 网 络 的 结果 代替 随机 模拟 。 这 完全 得 益 于 价值 网 络 估 值 的 准确 性 ,也 有 效 提 高 了 搜索 
速度 。 

(6) 只 用 了 4 块 张 量 处 理 单元 (Tensor Processing Unit,TPU) ,训练 72 小 时 就 可 以 
战胜 与 李 世 石 交手 的 AlphaGo Lee, 训 练 40 天 后 可 以 战胜 与 柯 洁 交 手 的 AlphaGo 


Master。 
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1.2.3 弱 人 工 智能 和 强人 工 智 能 


关于 人 工 智能 ,长 期 存在 两 种 不 同 的 目标 或 者 理念 。 一 种 是 希望 借鉴 人 类 的 智能 行 
为 ,研制 出 更 好 的 工具 ,以 减轻 人 类 智力 劳动 ,一 般 称 为 “ 弱 人 工 智能 ”, 类 似 于 “高 级 仿生 
学 ”。 另 一 种 是 希望 研制 出 达到 甚至 超越 人 类 智慧 水 平 的 人 造物 ,具有 心智 和 意识 、 能 根 
据 自 己 的 意图 开展 行动 ,一般 称 为 “强人 工 智 能 ” ,实则 可 谓 *“ 人 造 智能 ”。 

人 工 智能 技术 现在 取得 的 进展 和 成 功 ,是 缘 于 * 弱 人 工 智 能 ”, 而 不 是 “强人 工 智能 ”的 
研究 。 人 工 智 能 技术 所 取得 的 如 下 成 功 , 均 属于 * 弱 人 工 智能 ”: 在 图 像 识别 .语音 识别 方 
面 ,机 器 已 经 达到 甚至 超过 普通 人 类 的 水 平 ;在 机 器 翻译 方面 ,便携 的 实时 翻译 器 已 成 为 
现实 ;在 自动 推理 方面 ,机 器 很 早 就 能 进行 定理 自动 证 明 ;在 棋 类 游戏 方面 ,机 器 已 经 打败 
了 人 类 最 顶尖 的 棋 手 。 

正如 国际 人 工 智 能 联合 会 前 主席 .牛津 大 学 计算 机 系 主任 Michael Wooldrige 教授 在 
2016 年 CCF-GAIR 大 会 报告 中 所 说 : 强人 工 智能 “几乎 没有 进展 ”, 甚 至 “几乎 没有 严肃 
的 活动 *(*little progress，little serious activity”) 。 事 实 上 ,人 工 智 能 国际 主流 学 界 所 持 
的 目标 是 弱 人 工 智 能 ,也 少 有 人 致力 于 强人 工 智能 。 本 书 作 者 赞同 周志 华 在 “关于 强人 工 
智能 ”一 文中 的 3 个 观点 : 

(1) 从 技术 上 来 说 ,主流 人 工 智 能 学 界 的 努力 从 来 就 不 是 朝向 强人 工 智 能 , 现 有 技术 
的 发 展 也 不 会 自动 地 使 强人 工 智能 成 为 可 能 。 

(2) 即便 想 研 究 强人 工 智 能 ,也 不 知道 路 在 何方 。 即 便 能 精确 地 观察 和 仿制 出 神经 
细胞 的 行为 ,也 无 法 还 原 产生 出 智能 行为 。 

(3) 即便 强人 工 智 能 是 可 能 的 ,也 不 应 该 去 研究 它 。 强 人 工 智 能 的 造物 将 具有 自主 
心智 .独立 意识 ,那么 , 它 赁 什么 能 “甘心 ”为 人 类 服务 、 被 人 类 “奴役 ”?” 对 严肃 的 人 工 智能 
研究 者 来 说 ,如 果真 相信 自己 的 努力 会 产生 结果 , 那 就 不 该 去 触 碰 强人 工 智 能 。 


1.3 人工 智能 各 学 派 的 认 知 观 


目前 ,人 工 智能 的 主要 学 派 有 下 列 三 家 。 

(1) 符号 主义 (symbolicism) ,又 称 为 逻辑 主义 (logicism) 、 心 理学 派 (psychologism) 
或 计算 机 学 派 (computerism) ,其 原理 主要 为 物理 符号 系统 ( 即 符号 操作 系统 ) 假 设 和 有 限 
合理 性 原理 。 

(2) 连接 主义 (connectionism) ,又 称 为 仿生 学 派 (bionicsism) 或 生理 学 派 (physiologism)， 
其 原理 主要 为 神经 网 络 及 神经 网 络 间 的 连接 机 制 与 学 习 算 法 。 

(3) 行为 主义 (actionism) ,又 称 为 进化 主义 (evolutionism) 或 控制 论 学 派 (cyberneticsism)， 
其 原理 为 控制 论 及 感知 -动作 型 控制 系统 。 

他 们 对 人 工 智能 发 展 历史 具有 不 同 的 看 法 。 

1. 符号 主义 学 派 

认 知 基 元 是 符号 ,智能 行为 通过 符号 操作 实现 ,以 Robinson 提出 的 归结 原理 为 基础 ， 
以 LISP 和 Prolog 语言 为 代表 ;着 重 问题 求解 中 启发 式 搜索 和 推理 过 程 , 在 逻辑 思维 的 模 
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拟 方面 取得 成 功 , 如 自动 定理 证 明和 专家 系统 。 人 工 智 能 源 于 数理 逻辑 。 数 理 逻辑 和 计 
算 机 科学 具有 完全 相同 的 宗旨 : 扩展 人 类 大 脑 的 功能 ,帮助 人 脑 正确 .高 效 地 思维 。 它 们 
分 别 关 注 基础 理论 和 实用 技术 。 数 理 逻 辑 试图 找 出 构成 人 类 思维 或 计算 的 最 基础 的 机 
制 , 如 推理 中 的 “ 代 换 “匹配 “分 离 ”, 计 算 中 的 “运算 “迭代 “递归 ”。 而 计算 机 程序 设计 
则 是 要 把 问题 的 求解 归结 于 程序 设计 语言 的 几 条 基本 语句 ,其 至 归结 于 一 些 极其 简单 的 
机 器 操作 指令 。 

数理 逻辑 的 形式 化 方法 又 和 计算 机 科学 不 谋 而 合 。 计 算 机 系统 本 身 , 它 的 硬件 、 软 件 
都 是 一 种 形式 系统 ,它们 的 结构 都 可 以 形式 地 描述 ;程序 设计 语言 更 是 不 折 不 扣 的 形式 语 
言 系统 。 要 研究 计算 机 、 开 发 种 种 程序 设计 语言 ,没有 形式 化 知识 和 形式 化 能 力 是 难以 取 
得 出 色 成 果 的 。 另 外 ,应 用 计算 机 求解 实际 问题 ,首要 任务 便 是 形式 化 。 离 开 对 问题 正确 
的 形式 化 描述 ,没有 理性 的 机 器 何以 理解 .解答 这 些 问 题 ? 人 们 必须 用 计算 机 懂得 的 形式 
语言 告诉 它 “ 怎 么 做 ”或 者 “做 什么 ”, 而 计算 机 理解 这 些 语言 的 过 程 又 正 是 按照 人 赋予 它 
的 形式 化 规程 (编译 程序 ,compiler) ,将 它们 归 约 为 自己 的 基本 操作 。 

计算 机 科学 技术 人 员 常 常会 发 现 , 一 个 问题 的 逻辑 表达 式 几 乎 就 是 某 个 程序 设计 语 
言 ( 如 逻辑 程序 设计 语言 Prolog) 的 一 个 子 程序 ;而 用 有 些 语言 书写 的 程序 (如 关系 数据 
库 查询 语言 SQL 程序 ) 简 直 就 是 迎 辑 表达 式 。 事 实 上 , 正 是 数理 逻辑 对 “计算 ”的 追根 寻 
源 ,导致 第 一 个 计算 的 数学 模型 一 一 图 灵机 (Turing machines) 诞 生 , 它 被 公认 为 现代 数 
字 计 算 机 的 祖先 ;和 -演算 系统 为 第 一 个 人 工 智能 语言 LISP 奠定 了 基础 ;一 阶 谓词 演算 系 
统 为 计算 机 的 知识 表示 及 定理 证 明 铺 平 了 道路 ,以 其 为 根本 的 迎 辑 程序 设计 语言 Prolog 
曾 被 不 少 计算 机 科学 技术 专家 誉 为 新 一 代 计算 机 的 核心 语言 。 

目前 ,从 基本 好 辑 电 路 的 设计 到 巨型 机 、 智 能 机 系统 结构 的 研究 ,从 程序 设计 过 程 到 
程序 设计 语言 的 研究 发 展 , 从 知识 工程 到 新 一 代 计 算 机 的 研制 ,无 一 不 需要 数理 逻辑 的 知 
识 、 成 果 ,无 一 可 离开 数理 逻辑 家 的 智慧 与 贡献 。 

2. 连接 主义 学 派 

人 的 思维 基 元 是 神经 元 , 它 把 智能 理解 为 相互 联结 的 神经 元 竞争 与 协作 的 结果 ,以 人 
工 神经 网 络 为 代表 ,其 中 , 反 向 传播 (BP) 网 络 模型 和 Hopfield 网 络 模型 更 为 突出 ;着 重 结 
构 模 拟 , 研 究 神 经 元 特征 、 神 经 元 网 络 拓扑 、 学 习 规 则 、 网 络 的 非 线 性 动力 学 性 质 和 自 适应 
的 协同 行为 。 

连接 主义 学 派 认为 人 工 智 能 源 于 仿生 学 ,特别 是 对 人 脑 模型 的 研究 。 它 的 代表 性 成 
果 是 1943 年 由 生理 学 家 McCulloch 和 数理 逻辑 学 家 Pitts 创立 的 脑 模 型 , 即 MP 模型 , 开 
创 了 用 电子 装置 模仿 人 脑 结 构 和 功能 的 新 途径 。 它 从 神经 元 开始 ,进而 研究 神经 网 络 模 
型 和 脑 模型 ,开辟 了 人 工 智 能 的 又 一 发 展 道路 。20 世纪 60 一 70 年 代 , 连 接 主义 ,尤其 是 
对 以 感知 器 (perceptron) 为 代表 的 脑 模型 的 研究 曾 出 现 过 热潮 ,由 于 受到 当时 的 理论 模 
型 .生物 原型 和 技术 条 件 的 限制 , 脑 模型 研究 在 20 世纪 70 年 代 后 期 至 80 年 代 初期 落 入 
低潮 。 直 到 Hopfield 在 1982 年 和 1984 年 发 表 两 篇 重要 论文 ,提出 用 硬件 模拟 神经 网 络 
以 后 ,连接 主义 才 重 新 抬头 。1986 年 ,Rumelhart 等 人 提出 多 层 网 络 中 的 反 向 传播 算法 。 
20 世纪 90 年 代 , Vladimir Vapnik 提出 了 SVM, 虽 然 其 本 质 上 是 一 特殊 的 两 层 神 经 网 
络 , 但 因 其 具有 高 效 的 学 习 算 法 ,上 且 没有 局 部 最 优 的 问题 ,使 得 很 多 神经 网 络 的 研究 者 转 
向 SVM。 多 层 前 馈 神经 网 络 的 研究 逐渐 变 得 冷清 。 
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直到 2006 年 深度 网 络 (deep network) 和 深度 学 习 (deep learning) 概 念 的 提出 ,神经 
网 络 又 开始 焕发 一 轮 新 的 生命 。 深 度 网 络 ,从 字面 上 理解 就 是 深层 次 的 神经 网 络 。 这 个 
名 词 由 多 伦 多 大 学 的 Geoff Hinton 研究 组 于 2006 年 创造 。 事 实 上 ,Geoff Hinton 研究 
组 提出 的 这 个 深度 网 络 从 结构 上 讲 与 传统 的 多 层 感知 机 没有 什么 不 同 ,并 且 在 做 有 监督 
学 习 时 ,算法 也 是 一 样 的 。 唯 一 的 不 同 是 ,这 个 网 络 在 做 有 监督 学 习 前 要 先 做 非 监 督学 
习 , 然 后 将 非 监督 学 习 学 到 的 权 值 当 作 有 监督 学 习 的 初 值 进行 训练 。 

3. 行为 主义 学 派 

行为 主义 学 派 认 为 人 工 智能 源 于 控制 论 。 控 制 论 思想 早 在 20 世纪 40 一 50 年 代 就 成 
为 时 代 思 潮 的 重要 部 分 ,影响 了 早期 的 人 工 智 能 工作 者 。 控 制 论 把 神经 系统 的 工作 原理 
与 信息 理论 ,控制 理论 .逻辑 以 及 计算 机 联系 起 来 。 早 期 的 研究 工作 重点 是 模拟 人 在 控制 
过 程 中 的 智能 行为 和 作用 ,如 对 自 寻 优 、 自 适应 、 自 校正 、 自 镇 定 、 自 组 织 和 自学 习 等 控制 
论 系统 的 研究 ,并 进行 “控制 论 动物 ”的 研制 。 到 20 世纪 60 一 70 年 代 , 上 述 这 些 控制 论 系 
统 的 研究 取得 一 定 进展 , 播 下 智能 控制 和 智能 机 器 人 的 种 子 , 并 在 20 世纪 80 年 代 诞 生 了 
智能 控制 和 智能 机 器 人 系统 。 行 为 主义 是 20 世纪 末 才 以 人 工 智 能 新 学 派 的 面孔 出 现 的 ， 
引起 许多 人 的 兴趣 。 这 一 学 派 的 代表 作 首 推 Brooks 的 六 足 行走 机 器 人 , 它 被 看 作 是 新 一 
代 的 “控制 论 动物 ”, 是 一 个 基于 感知 -动作 模式 的 模拟 昆虫 行为 的 控制 系统 。 

反馈 是 控制 论 的 基石 ,没有 反馈 就 没有 智能 。 通 过 目标 与 实际 行为 之 间 的 误差 消除 
此 误差 的 控制 策略 。PID 控制 是 控制 论 对 付 不 确定 性 的 基本 手段 。 控 制 论 导致 机 器 人 研 
究 , 机 器 人 是 “感知 -行为 模式 ,是 没有 知识 的 智能 ;强调 系统 与 环境 的 交互 ,从 运行 环境 
中 获取 信息 ,通过 自己 的 动作 对 环境 施加 影响 。 

以 上 3 个 人 工 智 能 学 派 将 长 期 共存 与 合作 ,取长补短 ,并 走向 融合 和 集成 ,共同 为 人 
工 智能 的 发 展 做 出 贡献 。 


1.4 人 工 智能 的 研究 与 应 用 领域 


国际 人 工 智 能 联合 会 议 (JCAD 程 序 委员 会 将 人 工 智 能 领域 划分 为 : 约束 满足 问题 、 
知识 表示 与 推理 ,学 习 、 多 Agent、 自 然 语言 处 理 、 规 划 与 调度 、 机 器 人 学 、 搜 索 、 不 确定 性 
问题 ,网 络 与 数据 挖掘 等 。 大 会 建议 的 小 型 研讨 会 (Workshop) 主 题 包括 环境 智能 、 非 单 
调 推理 ,用 于 合作 性 知识 获取 的 语义 网 .音乐 人 工 智 能 . 认 知 系统 的 注意 问题 .面向 人 类 计 
算 的 人 工 智 能 .多 机 器 人 系统 ICT( 信 息 、. 通 信 、 技 术 ) 应 用 中 的 人 工 智能 .神经 -符号 的 学 
习 与 推理 以 及 多 模 态 的 信息 检索 等 。 

在 过 去 的 60 多 年 中 ,已 经 建立 了 一 些 具 有 人 工 智 能 的 计算 机 系统 。 例 如 ,能 够 求解 
微分 方程 的 .下 棋 的 、 设 计 分 析 集成 电路 的 、 合 成 人 类 自然 语言 的 .检索 情 报 的 、 诊 断 疾 病 
以 及 控制 太空 飞行 器 、 地 面 移动 机 器 人 和 水 下 机 器 人 的 具有 不 同 程度 人 工 智能 的 计算 机 

下 面 是 对 人 工 智 能 研究 和 应 用 的 讨论 ,试图 把 有 关 各 个 子 领域 直接 联结 起 来 ,辨别 某 
些 方面 的 智能 行为 ,并 指出 有 关 人 工 智 能 研究 和 应 用 的 状况 。 

这 里 要 讨论 的 各 种 智能 特性 之 间 也 是 相互 关联 的 ,把 它们 分 开 介绍 只 是 为 了 便于 指 
出 现 有 的 人 工 智能 程序 能 够 做 些 什么 和 还 不 能 做 什么 。 大 多 数 人 工 智能 研究 课题 都 涉及 
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许多 智能 领域 。 下 面 从 智能 感知 .智能 推理 ,智能 学 习 和 智能 行动 4 个 方面 进行 概述 。 


1.4.1 智能 感知 


1. 模式 识别 

模式 识别 是 对 表征 事物 或 现象 的 各 种 形式 的 (数值 的 ,文字 的 和 逻辑 关系 的 ) 信 息 进 
行 处 理 和 分 析 , 以 对 事物 或 现象 进行 描述 辨认、 分 类 和 解释 的 过 程 。 

人 们 在 观察 事物 或 现象 的 时 候 , 常 常 要 寻找 它 与 其 他 事物 或 现象 的 异同 之 处 ,根据 一 
定 的 目的 把 并 不 完全 相同 的 事物 或 现象 组 成 为 一 类 。 字 符 识 别 就 是 一 个 典型 的 例子 。 人 
脑 的 这 种 思维 能 力 就 构成 了 “模式 ”的 概念 。 

模式 识别 研究 主要 集中 在 两 方面 , 即 研究 生物 体 是 如 何 感知 对 象 的 ,以 及 在 给 定 的 任 
务 下 ,如 何 用 计算 机 实现 模式 识别 的 理论 和 方法 。 模 式 识 别 的 方法 有 感知 机 、 统 计 决策 方 
法 .基于 基 元 关系 的 句法 识别 方法 和 人 工 神经 元 网 络 方法 。 一 个 计算 机 模式 识别 系统 基 
本 上 由 3 部 分 组 成 , 即 数据 采集 、 数 据 处 理 和 分 类 决策 或 模型 匹配 。 

任何 一 种 模式 识别 方法 都 首先 要 通过 各 种 传感器 把 被 研究 对 象 的 各 种 物理 变量 转换 
为 计算 机 可 以 接受 的 数值 或 符号 集合 。 为 了 从 这 些 数值 或 符号 中 抽取 出 对 识别 有 效 的 信 
息 ,必须 对 它 进行 处 理 , 其 中 包括 消除 噪声 ,排除 不 相干 的 信号 以 及 与 对 象 的 性 质 和 采用 
的 识别 方法 密切 相关 的 特征 的 计算 和 必要 的 变换 等 。 然 后 通过 特征 选择 和 提取 或 基 元 选 
择 形 成 模式 的 特征 空间 ,以 后 的 模式 分 类 或 模型 匹配 就 在 特征 空间 的 基础 上 进行 。 系 统 
的 输出 或 者 是 对 象 所 属 的 类 型 ,或 者 是 模型 数据 库 中 与 对 象 最 相似 的 模型 的 编号 。 

实验 表明 ,人 类 接受 外 界 信息 的 80% 以 上 来 自视 觉 ,10% 左 右 来 自 听觉 。 所 以 ,早期 
的 模式 识别 研究 工作 集中 在 对 文字 和 二 维 图 像 的 识别 方面 ,并 取得 了 不 少 成 果 。 自 20 世 
纪 60 年 代 中 期 起 ,机 器 视觉 方面 的 研究 工作 开始 转向 解释 和 描述 复杂 的 三 维 景物 这 一 更 
困难 的 课题 。Robest 于 1965 年 发 表 的 论文 商定 了 分 析 由 棱柱 体 组 成 的 景物 的 方向 , 迈 
出 了 用 计算 机 把 三 维 图 像 解 释 成 三 维 景物 的 一 个 单眼 视图 的 第 一 步 , 即 所 谓 的 积木 世界 。 

接着 ,机 器 识别 由 积木 世界 进入 识别 更 复杂 的 景物 和 在 复杂 环境 中 寻找 目标 以 及 室 
外 景物 分 析 等 方面 的 研究 。 目 前 研究 的 热点 是 活动 目标 的 识别 和 分 析 , 它 是 景物 分 析 走 
向 实用 化 研究 的 一 个 标志 。 

语音 识别 技术 的 研究 始 于 20 世纪 50 年 代 初 期 。1952 年 ,美国 贝尔 实验 室 的 Davis 
等 人 成 功 地 进行 了 0 一 9 数字 的 语音 识别 实验 ,其 后 由 于 当时 技术 上 的 困难 ,研究 进展 缓 
慢 ,直到 1962 年 才 由 日 本 研制 成 功 第 一 个 连续 多 位 数字 语音 识别 装置 。1969 年 ,日 本 的 
板 仓 斋 萨 提 出 了 线性 预测 方法 ,对 语音 识别 和 合成 技术 的 发 展 起 到 了 推动 作用 。20 世纪 
70 年 代 以 来 ,各 种 语音 识别 装置 相继 出 现 ,性 能 良好 的 能 够 识别 单词 的 声音 识别 系统 已 
进入 实用 阶段 。 神 经 网 络 用 于 语音 识别 也 已 取得 成 功 。 

在 模式 识别 领域 ,神经 网 络 方法 已 经 成 功 地 应 用 于 手写 字符 的 识别 .汽车 牌照 的 识 
别 、 指 纹 识别 ,语音 识别 等 方面 。 模 式 识别 已 经 在 天 气 预 报 、 卫 星 航空 图 片 解释 、 工 业 产 品 
检测 .字符 识别 .语音 识别 .指纹 识别 、 医 学 图 像 分 析 等 许多 方面 得 到 了 成 功 的 应 用 。 

2. 计算 机 视觉 

计算 机 视觉 旨 在 对 描述 景物 的 一 幅 或 多 幅 图 像 的 数据 经 计算 机 处 理 , 以 实现 类 似 于 
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人 的 视觉 感知 功能 。 

有 些 学 者 把 为 实现 视觉 感知 所 要 进行 的 图 像 获 取 、 表 示 、 处 理 和 分 析 等 也 包含 在 计算 
机 视觉 中 ,使 整个 计算 机 视觉 系统 成 为 一 个 能 够 看 的 机 器 ,从 而 可 以 对 周围 的 景物 提取 各 
种 有 关 信 息 , 包 括 物体 的 形状 类别、 位 置 以 及 物理 特性 等 ,以 实现 对 物体 的 识别 理解 和 定 
位 ,并 在 此 基础 上 做 出 相应 的 决策 。 

景物 在 成 像 过 程 中 经 透视 投影 而 成 光学 图 像 ,再 经 过 取样 和 量化 ,得 到 由 各 像 元 的 灰 
度 值 组 成 的 二 维 阵 列 , 即 数字 图 像 ,这 是 计算 机 视觉 研究 中 最 常用 的 一 类 图 像 。 此 外 ,还 
用 到 由 激光 或 超声 测 距 装置 获取 的 距离 图 像 , 它 直接 表示 物体 表面 一 组 离散 点 的 深度 信 
息 。 用 多 种 传感器 实现 数据 融合 则 是 近年 来 获取 视觉 信息 的 重要 方法 。 

计算 机 视觉 的 基本 方法 是 : 获取 灰 度 图 像 ; 四 从 图 像 中 提取 边缘 、 周 长 、 惯 性 矩 等 
特征 ; @ 从 描述 已 知 物体 的 特征 库 中 选择 特征 匹配 最 好 的 相应 结 

整个 感知 问题 的 要 点 是 形成 一 个 精炼 的 表示 ,以 取代 难以 处 理 的 ,极其 庞大 的 、 未 经 
加 工 的 输入 数据 。 最 终 表 示 的 性 质 和 质量 取决 于 感知 系统 的 目标 。 不 同系 统 有 不 同 的 目 
标 ,但 所 有 系统 都 必须 把 来 自 输入 的 多 得 惊人 的 感知 数据 简化 为 一 种 易于 处 理 的 和 有 意 

对 不 同 层次 的 描述 做 出 假设 ,然后 测试 这 些 假设 ,这 一 策略 为 视觉 问题 提供 了 一 种 方 
法 。 已 经 建立 的 某 些 系 统 能 够 处 理 一 幅 景物 的 某 些 适当 部 分 ,以 此 扩展 一 种 描述 若干 成 
分 的 假设 。 然 后 这 些 假设 通过 特定 的 场景 描述 检测 器 进行 测试 。 这 些 测 试 结果 又 用 来 发 
展 更 好 的 假设 等 。 

计算 机 视觉 通常 可 分 为 低层 视觉 与 高 层 视觉 两 类 。 低 层 视 觉 主要 执行 预 处 理 功 能 ， 
如 边缘 检测 、 动 目标 检测 、 纹 理 分 析 , 通 过 阴影 获得 形状 、 立 体 造型 .曲面 色彩 等 ,其 目的 是 
使 被 观察 的 对 象 突现 出 来 。 高 层 视觉 则 主要 是 理解 所 观察 的 形象 。 

计算 机 视觉 的 前 沿 研究 领域 包括 实时 并 行 处 理 、 主 动 式 定性 视觉 动态 和 时 变 视觉 、 
三 维 景 物 的 建 模 与 识别 、 实 时 图 像 压 缩 传输 和 复原 、 多 光谱 和 彩色 图 像 的 处 理 与 解释 等 。 

计算 机 视觉 的 应 用 范围 很 广 , 例 如 ,条 形 码 识别 系统 、 指 纹 自 动 鉴定 系统 ,文字 识别 系 
统 . 生 物 医学 图 像 分 析 和 遥感 图 片 自动 解释 系统 无损 探 伤 系统 等 。 计 算 机 视觉 还 曾 用 于 
在 海湾 战争 中 使 用 过 的 战 佐 式 巡 航 导 弹 的 制导 。 该 视觉 系统 具有 近 红 外 和 可 见 光 的 传 感 
器 及 数字 场景 面积 匹配 器 ,在 距 目 标 15 千 米 的 范围 内 发 挥 作用 。 机 器 人 也 是 计算 机 视觉 
应 用 的 一 个 重要 领域 ,对 于 无 人 驾驶 自主 车 的 自动 导航 ,以 及 在 工业 装配 ,太空 ,深海 或 危 
险 环境 (如 核 辐射 ) 中 代替 人 工作 的 自主 式 机 器 人 ,计算 机 三 维 视觉 是 不 可 缺少 的 一 项 关 
键 技术 。 

3. 自然 语言 处 理 

自然 语言 处 理 是 用 计算 机 对 人 类 的 书面 和 口头 形式 的 自然 语言 信息 进行 处 理 加 工 的 
技术 , 它 涉及 语言 学 、 数 学 和 计算 机 科学 等 多 学 科 知识 领域 。 

自然 语言 处 理 的 主要 任务 在 于 建立 各 种 自然 语言 处 理 系统 ,如 文字 自动 识别 系统 、. 语 
音 自动 识别 系统 、 语 音 自动 合成 系统 .电子 词典 .机 器 翻译 系统 .自然 语言 人 机 接口 系统 、 
自然 语言 辅助 教学 系统 .自然 语言 信息 检索 系统 .自动 文摘 系统 .自动 索引 系统 .自动 校对 

自然 语言 在 以 下 4 个 方面 与 人 工 语言 有 很 大 差异 : 四 自然 语言 中 充满 歧义 ; 自然 
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语言 的 结构 复杂 多 样 ; 图 自然 语言 的 语义 表达 千变万化 ,至 今 还 没有 一 种 简单 而 通用 的 
途径 描述 它 ; 四 自然 语言 的 结构 和 语义 之 间 有 着 千 丝 万 缕 的 、 错 综 复 杂 的 联系 。 

自然 语言 处 理 的 研究 有 两 大 主流 : 一 个 是 面向 机 器 翻译 的 自然 语言 处 理 ; 另 一 个 是 
面向 人 机 接口 的 自然 语言 处 理 。 

20 世纪 90 年 代 , 在 自然 语言 处 理 中 ,开始 把 大 规模 真实 文本 的 处 理 作 为 今后 的 战略 
目标 ,重组 词汇 处 理 ,引入 了 语料库 方法 ,包括 统计 方法 、 基 于 实例 的 方法 以 及 通过 语 料 加 
工 , 使 语料库 转变 为 语言 知识 库 的 方法 等 。 

判断 计算 机 系统 是 否 真正 “理解 ?了 自然 语言 的 标准 有 问答 释义、 文摘 生成 和 翻译 。 

自然 语言 理解 的 研究 大 体 上 经 历 了 3 个 时 期 : 开始 是 以 关键 词 匹配 技术 为 主流 的 早 
期 ,随后 是 以 句法 -语义 分 析 方法 为 主流 的 中 期 ,最 后 是 走向 实用 化 和 工程 开发 的 近期 。 
在 这 个 过 程 中 发 展 和 完善 了 词法 分 析 、 句 法 分 析 、 语 义 分 析 和 语 境 分 析 技 术 , 先 后 提出 了 
短语 结构 语法 、 格 语法 以 及 基于 合 一 的 语法 理论 ,丰富 和 发 展 了 计算 语言 学 .语料库 语言 
学 和 计量 语言 学 。 

目前 可 以 将 任意 输入 的 源 语 言 的 句子 作为 处 理 对 象 的 机 器 翻译 系统 的 实现 方式 大 致 
可 分 为 3 类 : 直接 方式 、 转 换 方式 与 中 间 语 言 方 式 。 这 3 种 方式 的 共同 特点 是 机 器 翻译 
系统 必须 配备 庞大 的 规则 库 与 词典 ,可 以 统一 称 为 基于 规则 的 方法 。 

1984 年 ,京都 大 学 的 长 尾 真 提出 了 一 种 新 想法 : 直接 用 已 经 准备 好 的 短语 ,不 用 重 
复 翻 译 。 这 种 方法 称 为 基于 实例 的 方法 。 这 种 方法 的 基础 是 大 规模 的 双语 对 译 语料库 ， 
同时 需要 开发 最 佳 匹 配 检索 技术 和 适当 的 调整 机 制 。 随 着 语料库 语言 学 的 发 展 , 基 于 实 
例 的 机 器 翻译 方法 显示 出 它 的 优势 。 

2006 年 ,基于 短语 的 统计 机 器 翻译 (SMT) 开 始 实 用 化 。Google 翻译 .Yandex、 微 软 
必 应 等 在 线 翻 译 工 具 都 用 上 了 基于 短语 的 SMT ,一直 用 到 2016 年 。 在 这 个 时 期 , “统计 
机 器 翻译 ”通常 指 的 就 是 基于 短语 的 SMT, 直 到 2016 年 , 它 都 被 视 为 最 先进 的 机 器 翻译 
方法 。 

2014 年 ,一 篇 关于 在 机 器 翻译 中 使 用 神经 网 络 的 论文 对 外 发 布 。 作 者 包括 蒙特 利 尔 
大 学 的 Kyunghyun Cho Yoshua Bengio 等 人 。2016 年 9 月 ,Google 宣布 了 一 个 颠覆 性 
的 进展 。 这 就 是 神经 机 器 翻译 。 两 年 来 ,神经 网 络 超过 了 翻译 界 过 去 几 十 年 的 一 切 。 神 
经 翻译 的 单词 错误 减少 50% ,词汇 错误 减少 17% ,语法 错误 减少 19%。 

机 器 翻译 系统 既 可 采用 人 助 机 译 ,又 可 采用 机 助人 译 。 现 实 的 系统 还 需要 译 前 编辑 
或 译 后 编辑 。 电 子 词 典 是 机 器 翻译 系统 的 低级 形式 。 机 器 翻译 系统 性 能 及 其 译文 质量 的 
评价 问题 也 是 机 器 翻译 领域 的 一 个 重要 研究 课题 。 


1.4.2 智能 推理 


1. 概述 

对 推理 的 研究 往往 涉及 对 逻辑 的 研究 。 逻 辑 是 人 脑 思维 的 规律 ,从 而 也 是 推理 的 理 
论 基 础 。 机 器 推理 或 人 工 智能 用 到 的 逻辑 主要 包括 经 典 逻 辑 中 的 谓词 逻辑 和 由 它 经 某 种 
扩充 发 展 而 来 的 各 种 逻辑 ,后 者 通常 称 为 非 经 典 或 非 标准 逻辑 。 经 典 逻 辑 中 的 谓词 逻辑 
实际 是 一 种 表达 能 力 很 强 的 形式 语言 。 用 这 种 语言 不 仅 可 供 人 用 符号 演算 的 方法 进行 推 
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理 , 而 且 也 可 供 计算 机 用 符号 推演 的 方法 进行 推理 。 特 别 是 利用 一 阶 谓词 逻辑 不 仅 可 在 
机 器 上 进行 像 人 一 样 的 “自然 演绎 ?推理 ,而 且 还 可 以 实现 不 同 于 人 的 “归结 反 演 ?推理 。 
后 一 种 方法 是 机 器 推理 或 自动 推理 的 主要 方法 。 它 是 一 种 完全 机 械 化 的 推理 方法 。 基 了 
一 阶 谓词 逻辑 ,人 们 还 开发 了 一 种 人 工 智能 程序 设计 语言 Prolog。 

非 标准 逻辑 泛 指 除 经 典 逻 辑 以 外 的 逻辑 ,如 多 值 巡 辑 ` 多 类 逮 辑 、 模 糊 旬 辑 、 模 态 逻 
辑 \、 时 态 逻 辑 \ 动 态 逻 辑 , 非 单调 逻辑 。 各 种 非 标准 逻辑 是 在 为 弥补 经 典 逻辑 的 不 足 而 发 
展 起 来 的 。 例 如 ,为 了 克服 经 典 逻 辑 “ 二 值 性 ”限制 ,人 们 发 展 了 多 值 逻 辑 及 模糊 逻辑 。 实 
际 上 ,这 些 非 标准 逻辑 都 是 由 对 经 典 逻 辑 作 某 种 扩充 和 发 展 而 来 的 。 在 非 标 准 迎 辑 中 ,又 
可 分 为 两 种 情况 : 一 种 是 对 经 典 逻 辑 的 语义 进行 扩充 而 产生 的 ,如 多 值 逻辑 ,模糊 逻 辑 
等 。 这 些 好 辑 也 可 看 作 是 与 经 典 人 逻辑 平行 的 迎 辑 。 因 为 它们 使 用 的 语言 与 经 典 迎 辑 基 本 
相同 ,区 别 在 于 经 典 逻 辑 中 的 一 些 定理 在 这 种 非 标 准 逻 辑 中 不 再 成 立 , 而 且 增加 了 一 些 新 
的 概念 和 定理 。 另 一 种 是 对 经 典 逻辑 的 语 构 进 行 扩充 而 得 到 的 ,如 模 态 迎 辑 .时 态 逻 辑 
等 。 这 些 迎 辑 一 般 都 承认 经 典 巡 辑 的 定理 ,但 在 两 个 方面 进行 了 补充 ,一 是 扩充 了 经 典 四 
辑 的 语言 ,二 是 补充 了 经 典 逻 辑 的 定理 。 例 如 , 模 态 逻辑 增加 了 两 个 新 算 子 L(…… 是 必 
然 的 ) 和 M(…… 是 可 能 的 ) ,从 而 扩大 了 经 典 逻 辑 的 词汇 表 。 

上 述 迎 辑 为 推理 (特别 是 机 器 推理 ) 提 供 了 理论 基础 ,同时 也 开辟 了 新 的 推理 技术 和 
方法 。 随 着 推理 的 需要 ,还 会 出 现 一 些 新 的 迎 辑 ;同时 ,这 些 新 逻辑 也 会 提供 一 些 新 的 推 
理 方法 。 事 实 上 ,推理 与 逻辑 是 相辅相成 的 。 一 方面 ,推理 为 逻辑 提出 课题 ; 男 一 方面 ,由 
辑 为 推理 黄 定 基础 。 

2. 搜索 技术 

所 谓 搜索 ,就 是 为 了 达到 某 一 “目标 ”, 而 连续 进行 推理 的 过 程 。 搜 索 技术 就 是 对 推理 
进行 引导 和 控制 的 技术 。 智 能 活动 的 过 程 可 看 作 或 抽象 为 一 个 “问题 求解 ”过 程 。 而 所 谓 
“问题 求解 ”过 程 ,实质 上 就 是 在 显 式 的 或 隐 式 的 问题 空间 中 进行 搜索 的 过 程 , 即 在 某 一 状 
态 图 ,或 者 与 或 图 ,或 者 一 般 说 ,在 某 种 迎 辑 网 络 上 进行 搜索 的 过 程 。 例 如 ,难题 求解 (如 
旅行 商 问题 ) 是 明显 的 搜索 过 程 ,而 定理 证 明 实际 上 也 是 搜索 过 程 , 它 是 在 定理 集合 (或 空 
间 ) 上 搜索 的 过 程 。 

搜索 技术 也 是 一 种 规划 技术 。 因 为 对 于 有 些 问 题 ,其 解 就 是 由 搜索 而 得 到 的 “路 径 ”。 
在 人 工 智能 研究 的 初期 “启发 式 ” 搜 索 算法 曾 一 度 是 人 工 智 能 的 核心 课题 。 传 统 的 搜索 
技术 都 是 基于 符号 推演 方式 进行 的 。 近 年 来 ,人 们 又 将 神经 网 络 技术 用 于 问题 求解 ,开辟 
了 问题 求解 与 搜索 技术 研究 的 新 途径 。 例 如 ,用 Hopfield 网 解决 31 个 城市 的 旅行 商 问 
题 ,已 取得 很 好 的 效果 。 

3. 问题 求解 

人 工 智能 的 成 就 之 一 是 开发 了 高 水 平 的 下 棋 程 序 。 在 下 棋 程 序 中 应 用 的 某 些 技术 ， 
如 向 前 看 几 步 ,并 把 困难 的 问题 分 成 一 些 比 较 容 易 的 子 问题 ,发 展 成 为 搜索 和 问题 归 约 这 
样 的 人 工 智能 基本 技术 。 今 天 的 计算 机 程序 能 够 下 锦标 赛 水 平 的 各 种 方 盘 棋 、 十 五 子 棋 、 
国际 象棋 和 围棋 ,并 取得 计算 机 棋 手 战胜 国际 象棋 冠军 和 围棋 冠军 的 成 果 。 另 一 种 问题 
求解 程序 能 够 进行 各 种 数学 公式 运算 ,其 性 能 达到 很 高 的 水 平 ,并 正在 为 许多 科学 家 和 工 
程 师 所 应 用 。 有 些 程序 甚至 还 能 够 用 经 验 改善 其 性 能 。 有 些 软件 能 够 进行 比较 复杂 的 数 
学 公式 符号 运算 。 
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未 解决 的 问题 包括 人 类 棋 手 具有 的 但 尚 不 能 明确 表达 的 能 力 ,如 国际 象棋 大 师 们 洞 
察 棋 局 的 能 力 。 另 一 个 未 解决 的 问题 涉及 问题 的 原 概念 ,在 人 工 智能 中 叫 作 问题 表示 的 
选择 。 人 们 常常 能 够 找到 某 种 思考 问题 的 方法 ,从 而 使 求解 变 得 容易 而 最 终 解决 该 问题 。 
到 目前 为 止 , 人 工 智 能 程序 已 经 知道 如 何 考虑 要 解决 的 问题 , 即 搜索 解 空间 ,寻找 较 优 的 
解答 。 

4. 定理 证 明 

早期 的 逻辑 演绎 研究 工作 与 问题 和 难题 的 求解 相当 密切 。 已 经 开发 出 的 程序 能 够 借 
助 对 事实 数据 库 的 操作 * 证 明 "断定 ;其 中 每 个 事实 由 分 立 的 数据 结构 表示 ,就 像 数理 多 辑 
中 由 分 立 公 式 表示 一 样 。 与 人 工 智能 其 他 技术 的 不 同 之 处 是 ,这 些 方 法 能 够 完整 地 ,一 致 
地 加 以 表示 。 也 就 是 说 ,只 要 本 原 事 实 是 正确 的 ,那么 程序 就 能 够 证 明 这 些 从 事实 得 出 的 
定理 ,而 且 也 仅仅 是 证 明 这 些 定理 。 

对 数学 中 脐 测 的 定理 寻找 一 个 证 明 或 反 证 ,确实 称 得 上 是 一 项 智能 任务 。 为 此 ,不 仅 
需要 有 根据 假设 进行 演绎 的 能 力 , 而 且 需 要 某 些 直觉 技巧 。 例 如 ,为 了 求证 主要 定理 而 猜 
测 应 当 首先 证 明 哪 一 个 引 理 。 一 个 熟练 的 数学 家 运用 他 的 判断 力 能 够 精确 地 推测 出 某 个 
科目 范围 内 哪些 已 证 明 的 定理 在 当前 的 证 明 中 是 有 用 的 ,并 把 他 的 主 问题 归结 为 若干 子 
问题 ,以 便 独 立地 处 理 它 们 。 有 几 个 定理 证 明 程 序 已 在 有 限 的 程度 上 具有 某 些 这 样 的 技 
巧 。1976 年 7 月 ,美国 的 K. Appel 等 人 合作 解决 了 长 达 124 年 之 久 的 难题 一 一 四 色 定 
理 。 他 们 用 3 台大 型 计算 机 , 花 去 1200 小 时 CPU 时 间 , 并 对 中 间 结 果 进 行人 为 反复 修改 
达 500 多 处 。 吴 文俊 院士 提出 并 实现 的 几何 定理 机 器 证 明 的 方法 一 一 吴 氏 方法 ”, 是 定 
理 证 明 领 域 的 一 项 标志 性 成 果 。 

5. 专家 系统 和 知识 库 

专家 系统 是 一 个 基于 专门 的 领域 知识 求解 特定 问题 的 计算 机 程序 系统 ,主要 用 来 模 
仿 人 类 专家 的 思维 活动 ,通过 推理 与 判断 求解 问题 。 

一 个 专家 系统 主要 由 以 下 两 部 分 组 成 : 一 是 称 为 知识 库 的 知识 集合 , 它 包 括 要 处 理 
问题 的 领域 知识 ;二 是 称 为 推理 机 的 程序 模块 , 它 包含 一 般 问题 求解 过 程 所 用 的 推理 方法 
与 控制 策略 的 知识 。 

推理 是 指 从 已 有 事实 推出 新 事实 (或 结论 ) 的 过 程 。 人 类 专家 能 够 高 效率 求解 复杂 问 
题 ,除了 因为 他 们 拥有 大 量 的 专门 知识 外 ,还 体现 在 他 们 选择 知识 和 运用 知识 的 能 力 方 
面 。 知 识 的 运用 方式 称 为 推理 方法 ,知识 的 选择 过 程 称 为 控制 策略 。 

好 的 专家 系统 应 能 为 用 户 解释 它 是 如 何 求 解 问题 的 ,或 者 推理 过 程 中 结论 获得 的 理 
由 ,或 者 为 什么 所 期 望 的 结论 没有 达到 。 

专家 系统 中 的 知识 往往 具有 不 确定 性 或 不 精确 性 , 它 必须 能 够 使 用 这 些 模糊 的 知识 
进行 推理 ,以 得 出 结论 。 专 家 系统 可 用 于 解释 、 预 测 ,诊断 、 设 计 、 规 划 、 监 督 . 排 错 ,控制 和 
教学 等 。 专 家 系统 构造 过 程 一 般 有 以 下 5 个 相互 依赖 、 相 互 重生 的 阶段 : 识别 ,概念 化 、 
形式 化 、 实 现 与 验证 。 

专家 系统 的 实现 一 般 是 采用 专家 系统 开发 工具 进行 的 。 在 美国 , 绝 大 多 数 专家 系统 
使 用 外 壳 这 类 开发 工具 实现 ,也 可 使 用 程序 设计 语言 实现 。LISP 语言 是 一 种 表 人 处理 语 
言 , 它 是 许多 专家 系统 编程 语言 的 基础 。 欧 洲 和 日 本 常用 逻辑 编程 实现 专家 系统 ,广泛 使 
用 的 语言 是 Prolog, 它 基于 一 阶 谓词 演算 。 
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专家 系统 的 运行 与 维护 都 需要 一 个 良好 的 支持 环境 ,这 个 支持 环境 不 但 要 包括 易学 、 
易 用 的 人 机 界面 ,而 且 还 要 有 能 方便 地 排除 知识 表示 中 语法 错误 .语义 错误 的 知识 库 编 辑 
工具 。 

从 20 世纪 70 年 代 后 期 以 来 ,美国 欧洲 .日 本 以 及 中 国 出 现 了 一 大 批 应 用 于 各 和 领域 
的 专家 系统 ,涉及 医学 .化 学 .生物 .工程 .法律 农业、 商业 教育 .军事 等 领域 ,产生 了 很 好 
的 社会 与 经 济 效益 。 

近年 来 ,在 专家 系统 广泛 应 用 于 各 领域 的 基础 上 ,诞生 了 分 布 式 专家 系统 和 与 其 他 信 
息 系统 相 结 合 的 新 型 综合 的 专家 系统 或 智能 信息 系统 。 

知识 库 类 似 于 数据 库 。 知 识 库 技术 包括 知识 的 组 织 、 管 理 、 维 护 、 优 化 等 技术 。 对 知 
识 库 的 操作 要 靠 知 识 库 管理 系统 的 支持 。 知 识 库 与 知识 表示 密切 相关 ,知识 表示 是 指 知 
识 在 计算 机 中 的 表示 方法 和 表示 形式 , 它 涉及 知识 的 逻辑 结构 和 物理 结构 。 知 识 表 示 实 
际 也 隐 含 着 知识 的 运用 ,知识 表示 和 知识 库 是 知识 运用 的 基础 ,同时 也 与 知识 的 获取 密切 
相关 。 

知识 表示 与 知识 库 的 研究 内 容 包 括 知识 的 分 类 、 知 识 的 一 般 表 示 模 式 不 确定 性 
知识 的 表示 、 知 识 分 布 表 示 、 知 识 库 的 模型 .知识 库 与 数据 库 的 关系 、 知 识 库 管理 系 

“知识 就 是 智能 ”, 因 为 所 谓 智能 ,就 是 发 现 规律 .运用 规律 的 能 力 , 而 规律 就 是 知识 。 
发 现 知识 和 运用 知识 本 身 还 需要 知识 。 因 此 ,知识 是 智能 的 基础 和 源泉 。 

6. 大 数据 知识 工程 

2015 年 9 月 , 吴 信 东 与 郑 南宁 院士 、 陆 汝 铃 院 士 等 提出 了 大 数据 知识 工程 的 顶层 设 
计 与 研究 纲要 。 大 数据 知识 工程 的 基本 目标 是 研究 如 何 利 用 海量 、 低 质 .无 序 的 碎片 化 知 
识 进行 问题 求解 与 知识 服务 。 不 同 于 依靠 领域 专家 的 传统 知识 工程 ,大 数据 知识 工程 除 
权威 知识 源 以 外 ,知识 主要 来 源 于 用 户 生 成 内 容 (User-Generated Contents，UGC) ,知识 
库 具备 自 完 善 与 增殖 能 力 ,问题 求解 过 程 能 够 根据 用 户 交 互 进行 学 习 。 大 数据 知识 工程 
有 望 突破 以 专家 知识 为 核心 的 传统 知识 工程 中 的 “知识 获取 ”和 * 知 识 再 工程 ?两 个 瓶颈 
问题 。 

大 数据 知识 工程 的 研究 将 以 我 国 经 济 社会 发 展 对 大 数据 知识 工程 的 战略 需求 为 牵 
引 , 以 多 源 海 量 碎片 化 数据 到 知识 的 “在 线 学 习 - 拓 扑 融合 -知识 导航 ?转换 为 主线 ,针对 知 
识 碎 片 化 引发 的 知识 表示 、 质 量 、 适 配 等 问题 ,围绕 “探索 碎片 化 知识 发 现 ,表示 与 演化 规 
律 交 揭示 碎片 化 知识 拓扑 融合 机 理 交 构建 个 性 化 知识 导航 的 交互 模型 3 个 科学 问题 开 
展 基础 理论 和 关键 技术 研究 ,建立 一 套 大 数据 知识 工程 的 理论 体系 ,突破 碎片 化 知识 发 
现 、 融 合 、 服 务 的 核心 技术 ,研制 出 碎片 化 知识 融合 与 导航 服务 原型 系统 ,开发 出 具有 高 附 
加 值 的 面向 碎片 化 知识 的 处 理工 具 。 

该 项 目 将 以 领域 开放 知识 源 为 对 象 ,通过 碎片 化 知识 挖掘 与 融合 ,建立 具有 增殖 、 适 
配 、 群 智 特 点 的 PB 级 数据 与 知识 中 心 , 并 研制 出 具有 碎片 化 采集 ,挖掘 \ 分 析 、 融 合 、 导 航 
等 功能 的 系列 化 工具 软件 ,为 研究 成 果 的 应 用 提供 技术 支撑 。 项 目 示 范 领域 包括 普 适 医 
疗 、 远 程 教育 “互联 网 十 旅游 ”3 个 知识 密集 型 应 用 领域 。 在 普 适 医疗 领域 ,将 选择 糖尿 
病 、 痛 风 、 高 血压 等 疾病 ,开展 面向 辅助 诊断 的 示范 应 用 ,建立 基于 大 数据 知识 工程 的 认 知 
医疗 新 模式 。 该 模式 不 再 仅 依赖 医护 专家 的 知识 ,也 依赖 患者 病历 、 医 学 文献 等 相关 数据 
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中 的 碎片 化 知识 ;另外 ,该 模式 强调 患者 本 身 对 医学 过 程 的 反馈 ,能 寻找 到 针对 个 体 的 个 
性 化 诊断 结果 ,实现 精准 医疗 。 在 远程 教育 领域 ,该 项 目 将 建立 基于 大 数据 知识 工程 的 网 
络 化 认 知 模式 ,该 模式 能 够 将 多 源 分 布 的 低 质 碎片 化 知识 进行 融合 ,形成 符合 人 类 认 知 特 
点 的 结构 化 组 织 形式 ,降低 学 习 者 认 知 负荷 。 另 外 ,该 模式 能 够 基于 知识 关联 实现 知识 导 
航 , 有 望 克服 碎片 化 知识 离散 、 无 序 性 导致 的 认 知 迷航 问题 。 在 “互联 网 十 旅游 "领域 ,将 
利用 大 数据 知识 工程 ,对 用 户 生成 内 容 中 与 旅游 有 关 的 海量 碎片 化 知识 进行 融合 与 重 构 ， 
结合 游客 属性 ,行为 .旅游 景区 或 目的 地 的 偏好 度 进行 分 析 , 将 海量 碎片 化 知识 形成 可 行 
动 的 智慧 ,实现 传统 的 旅游 服务 向 具有 “智慧 推送 、 精 准 服务 "特点 的 个 性 化 服务 模式 


1.4.3 智能 学 习 


1. 概述 

学 习 是 人 类 智能 的 主要 标志 和 获得 知识 的 基本 手段 。 机 器 学 习 ( 自 动 获取 新 的 事实 
及 新 的 推理 算法 ) 是 使 计算 机 具有 智能 的 根本 途径 。 学 习 是 一 个 有 特定 目的 的 知识 获取 
过 程 ,其 内 部 表现 为 新 知识 结构 的 不 断 建立 和 修改 ,而 外 部 表现 为 性 能 的 改善 。 一 个 学 习 
过 程 本 质 上 是 学 习 系 统 把 导师 (或 专家 ) 提 供 的 信息 转换 成 能 被 系统 理解 并 应 用 的 形式 的 
过 程 。 

机 器 学 习 研究 计算 机 怎样 模拟 或 实现 人 类 的 学 习 行 为 ,以 获取 新 的 知识 或 技能 ,重新 
组 织 已 有 的 知识 结构 ,使 之 不 断 改善 自身 的 性 能 。 

一 般 来 说 ,环境 为 学 习 单元 提供 外 界 信息 源 ,学 习 单元 利用 该 信息 对 知识 库 做 出 改 
进 ,执行 单元 利用 知识 库 中 的 知识 执行 任务 ,任务 执行 后 的 信息 又 反馈 给 学 习 单元 作为 进 
一 步 学 习 的 输入 。 

学 习 方法 通常 包括 : 归纳 学 习 、 类 比 学 习 、 分 析 学 习 、 连 接 学 习 和 遗传 学 习 。 

归纳 学 习 从 具体 实例 出 发 ,通过 归纳 推理 ,得 到 新 的 概念 或 知识 。 归 纳 学 习 的 基本 操 
作 是 泛 化 和 特 化 , 泛 化 是 使 规则 能 匹配 应 用 于 更 多 的 情形 或 实例 。 特 化 操作 则 相反 ,减少 
规则 适用 的 范围 或 事例 。 

类 比 学 习 以 类 比 推理 为 基础 ,通过 识别 两 种 情况 的 相似 性 ,使 用 一 种 情况 中 的 知识 分 
析 或 理解 另 一 种 情况 。 

分 析 学 习 是 利用 背景 或 领域 知识 ,分 析 很 少 的 典型 实例 ,然后 通过 演绎 推导 ,形成 新 
的 知识 ,使 得 对 领域 知识 的 应 用 更 有 效 。 分 析 学 习 方 法 的 目的 在 于 改进 系统 的 效率 与 性 
能 ,而 同时 不 牺牲 其 准确 性 和 通用 性 。 

连接 学 习 是 在 人 工 神经 网 络 中 ,通过 样本 训练 ,修改 神经 元 间 的 连接 强度 ,甚至 修改 
神经 网 络 本 身 结 构 的 一 种 学 习 方法 ,主要 基于 样本 数据 进行 学 习 。 

遗传 学 习 源 于 模拟 生物 繁殖 中 的 遗传 变异 原则 (如 交换 、 突 变 等 ) 以 及 达尔 文 的 自然 
选择 原则 (生态 圈 中 适 者 生存 )。 一 个 概念 描述 的 各 种 变 体 或 版 本 对 应 于 一 个 物种 的 各 个 
个 体 , 这 些 概念 描述 的 变 体 在 发 生 突变 和 重组 后 ,经 过 某 种 目标 函数 (与 自然 选择 准则 对 
应 ) 的 衡量 ,决定 谁 被 淘汰 , 谁 继续 生存 下 去 。 








0 人 工 者 能 ( 荔 了 版 ) 


2. 记忆 与 联想 

记忆 是 智能 的 基本 条 件 ,不 管 是 脑 智 能 ,还 是 群 智能 ,都 以 记忆 为 基础 。 记 忆 也 是 人 
脑 的 基本 功能 之 一 。 在 人 脑 中 ,伴随 着 记忆 的 就 是 联想 ,联想 是 人 脑 的 奥秘 之 一 。 

计算 机 要 模拟 人 脑 的 思维 ,就 必须 具有 联想 功能 . 要 实现 联想 ,无 非 就 是 建立 事物 之 
间 的 联系 。 在 机 器 世界 里 面 ,就 是 有 关 数 据 、 信 息 或 知识 之 间 的 联系 。 当 然 ,建立 这 种 联 
系 的 办 法 很 多 ,如 用 指针 、 函 数 、 链 表 等 。 我 们 通常 的 信息 查询 就 是 这 样 做 的 ,但 传统 方法 
实现 的 联想 只 能 对 于 那些 完整 的 、 确 定 的 (输入 ) 信 息 , 联 想起 (输出 ) 有 关 的 信息 。 这 种 
“联想 "与 人 脑 的 联想 功能 相差 甚 远 。 人 脑 对 那些 残缺 的 .失真 的 、 变 形 的 输入 信息 ,仍然 
可 以 快速 准确 地 输出 联想 响应 。 

从 机 器 内 部 的 实现 方法 看 ,传统 的 信息 查询 是 基于 传统 计算 机 的 按 地 址 存 取 方式 进 
行 的 。 而 研究 表明 ,人 脑 的 联想 功能 是 基于 神经 网 络 的 按 内 容 记忆 方式 进行 的 。 也 就 是 
说 ,只 要 是 内 容 相 关 的 事情 ,不 管 在 哪里 (与 存储 地 址 无 关 ) ,都 可 由 其 相关 的 内 容 被 想起 。 
例如 ,苹果 这 一 概念 ,一 般 有 形状 ,大 小 .颜色 等 特征 ,我 们 要 介绍 的 内 容 记忆 方 式 就 是 由 
形状 (如 苹果 是 圆 形 的 ) 想 起 颜色 ,大 小 等 特征 ,而 不 需要 关心 其 内 部 地 址 。 

当前 ,在 机 器 联想 功能 的 研究 中 ,人 们 就 是 利用 这 种 按 内 容 记忆 原理 ,采用 一 种 称 为 
“联想 存储 ”的 技术 实现 联想 功能 。 联 想 存储 的 特点 是 : 可 以 存储 许多 相关 (激励 ,响应 ) 
模式 对 ;通过 自 组 织 过 程 可 以 完成 这 种 存储 ;以 分 布 . 稳 健 的 方式 (可 能 会 有 很 高 的 宛 余 
度 ) 存 储 信息 ;可 以 根据 接收 到 的 相关 激励 模式 产生 并 输出 适当 的 响应 模式 ;即使 输入 激 
励 模式 失真 或 不 完全 时 ,仍然 可 以 产生 正确 的 响应 模式 ;可 在 原 存 储 中 加 入 新 的 存储 
模式 。 

3. 神经 网 络 

人 工 神经 网 络 (也 称 神 经 网 络 计算 ,或 神经 计算 ) 实 际 上 指 的 是 一 类 计算 模型 ,其 工作 
原理 模仿 了 人 类 大 脑 的 某 些 工 作 机 制 。 这 种 计算 模型 与 传统 的 计算 机 的 计算 模型 完全 不 
同 。 传 统 的 计算 模型 是 这 样 的 , 它 利 用 一 个 (或 几 个 ) 计 算 单元 ( 即 CPU) 担 负 所 有 的 计算 
任务 ,整个 计算 过 程 是 按时 间 序 列 一 步 步 地 在 该 计算 单元 中 完成 的 ,本 质 上 是 串 行 计算 。 
神经 计算 则 是 利用 大 量 简单 计算 单元 组 成 一 个 大 网 络 , 通 过 大 规模 并 行 计 算 完 成 。 由 于 
其 思想 的 新 颖 性 ,所 以 一 开始 就 受到 广泛 重视 。 

从 计算 模型 看 , 它 是 由 大 量 简单 的 计算 单元 组 成 网 络 进行 计算 。 这 种 计算 模型 具有 
鲁 棒 性 、 适 应 性 和 并 行 性 。 这 是 传统 计算 没有 的 。 

从 方法 论 的 角度 看 ,传统 的 计算 依靠 自 顶 向 下 的 分 析 , 先 利用 先 验 知识 建立 数学 的 、 
物理 的 或 推理 的 模型 。 在 此 基础 上 建立 相应 的 计算 模型 进行 计算 ,但 神经 网 络 计算 是 自 
底 向 上 的 , 它 很 少 利用 先 验 知识 ,直接 从 数据 通过 学 习 与 训练 ,自动 建立 计算 模型 。 可 见 ， 
神经 网 络 计算 表现 出 很 强 的 灵活 性 、 适 应 性 和 学 习 能 力 , 这 是 传统 计算 方法 所 缺乏 的 。 

神经 计算 存在 一 些 本 质 困难 : 首先 是 效率 问题 ,学 习 的 复杂 性 始终 是 困扰 神经 网 络 
研究 的 一 大 难题 。 因 此 ,寻找 有 效 的 学 习 算 法 是 其 中 的 一 大 关键 。 其 次 , 正 由 于 先 验 知识 
少 , 神 经 网 络 的 结构 很 难 预先 确定 ,只 能 通过 反复 学 习 , 以 寻找 一 个 合适 的 结构 ,因此 由 此 
确定 的 结构 也 就 很 难 被 人 理解 。 

对 神经 网 络 的 研究 始 于 20 世纪 40 年 代 初 期 .经 历 了 一 条 十 分 曲折 的 道路 , 几 起 几 
落 ,20 世纪 80 年 代 初 以 来 ,对 神经 网 络 的 研究 再 次 出 现 高 潮 。Hopfield 提出 用 硬件 实现 
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神经 网 络 ,Rumelhart 等 人 提出 多 层 网 络 中 的 反 向 传播 (BP) 算 法 就 是 两 个 重要 标志 。 

对 神经 网 络 模 型 算法、 理论 分 析 和 硬件 实现 的 大 量 研究 ,为 神经 网 络 计算 机 走向 应 
用 提供 了 物质 基础 。 现 在 ,神经 网 络 已 在 模式 识别 .图 像 处 理 、 组 合 优化 .自动 控制 .信息 
处 理 . 机 器 人 学 和 人 工 智 能 的 其 他 领域 获得 日 益 广泛 的 应 用 。 

神经 计算 的 可 扩展 性 (scalability) 和 可 理解 性 (understandability) 是 采用 神经 网 络 技 
术 解 决 现实 问题 必须 面 对 的 困难 。 任 何 神经 网 络 方法 都 要 经 受 问 题 规模 和 海量 数据 的 

4. 深度 学 习 、 迁 移 学 习 

2006 年 ,多 伦 多 大 学 的 杰 夫 。 辛 顿 研究 组 在 (科学 》 上 发 表 了 关于 深度 学 习 的 文章 ; 
2012 年 ,他 们 参加 计算 机 视觉 领域 著名 的 ImageNet 竞赛 ,使 用 深度 学 习 模型 以 超过 第 二 
名 10 个 百分点 的 成 绩 夺冠 ,引起 大 家 的 关注 。2015 年 ,微软 研究 院 在 ImageNet 竞赛 夺 
冠 的 模型 中 使 用 了 152 层 网 络 。 深 度 学 习 的 成 功 有 3 个 重要 条 件 : 大 数据 强力 计 算 设 
备 , 大 量 工程 研究 人 员 进 行 尝试 。 目 前 ,深度 学 习 在 图 像 .语音 .视频 等 应 用 领域 都 取得 了 
很 大 成 功 。 

深度 学 习 会 继续 发 展 。 这 里 的 发 展 不 仅 包括 层次 的 增加 ,还 包括 深度 学 习 的 可 解释 
性 以 及 对 深度 学 习 所 获得 的 结论 的 自我 因果 表达 。 例 如 ,如 何 把 非 结 构 化 数据 作为 原始 
数据 ,训练 出 一 个 统计 模型 ,再 把 这 个 模型 变 成 某 种 知识 的 表达 一 一 这 是 一 种 表示 学 习 。 
这 种 技术 对 于 非 结构 化 数据 ,尤其 对 于 自然 语言 里 面 的 知识 学 习 , 是 很 有 帮助 的 。 另 外 ， 
深度 学 习 模 型 的 结构 设计 是 深度 学 习 的 一 个 难点 。 这 些 结构 都 是 需要 由 人 设计 的 。 如 何 
让 逻辑 推理 和 深度 学 习 一 起 工作 ,增加 深度 学 习 的 可 解释 性 也 是 需要 研究 的 问题 。 例 如 ， 
建立 一 个 贝 叶 斯 模型 需要 设计 者 具有 丰富 的 经 验 ,到 现在 为 止 ,基本 上 都 是 由 人 设计 的 。 
如 果 能 从 深度 学 习 的 学 习 过 程 中 衍生 出 一 个 贝 叶 斯 模型 ,那么 ,学习 、 解 释 和 推理 就 可 以 
统一 起 来 了 。 

给 定 一 个 深度 学 习 网 络 ,如 一 个 encoder 网 络 和 一 个 decoder 网 络 ,观察 它 学 习 和 迁 
移 的 过 程 ,作为 新 的 数据 训练 另 一 个 可 解释 的 模型 ,也 可 以 作为 一 个 新 的 迁移 学 习 算 法 的 
输出 。 这 就 好 比 一 个 学 生 A 在 观察 另外 一 个 学 生 B 学 习 ,A 的 目的 是 学 习 B 的 学 习 方 
法 ,B 不 断 地 学 习 新 的 领域 ,每 换 一 个 领域 就 为 A 提供 一 个 新 的 数据 样本 ,A 利用 这 些 新 
的 样本 就 能 学 会 在 领域 之 间 做 迁移 。 这 种 过 程 叫 作 观 察 网 络 。 有 了 这 种 一 边 学 习 、 一 边 
学 习 学 习 方法 的 算法 ,就 可 以 在 机 器 学 习 的 过 程 中 学 会 迁移 的 方法 。 

未 来 ,我 们 把 深度 学 习 、 强 化 学 习 和 迁移 学 习 相 结合 ,可 以 实现 几 个 突破 一 一 反馈 可 
以 延迟 ,通用 的 模型 可 以 个 性 化 ,可 以 解决 冷 启动 的 问题 等 。 这 样 的 一 个 复合 模型 叫 作 深 
度 .强化 迁移 学 习 模型 。 

5. 计算 智能 与 进化 计算 

计算 智能 (computing intelligence) 涉 及 神经 计算 、 模 糊 计 算 、 进 化 计算 等 研究 领域 。 
在 此 仅 对 进化 计算 加 以 介绍 。 

进化 计算 (evolutionary computation) 是 指 一 类 以 达尔 文 进化 论 为 依据 设计 ,控制 和 
优化 人 工 系统 的 技术 和 方法 的 总 称 , 它 包 括 遗 传 算法 (genetic algorithm)、 进 化 策略 
(evolutionary strategy) 和 进化 规划 (evolutionary programming)。 它 们 遵循 相同 的 指导 
思想 ,但 彼此 存在 一 定 差别 。 同 时 ,进化 计算 的 研究 关注 学 科 的 交叉 和 广泛 的 应 用 背景 ， 
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因而 引入 了 许多 新 的 方法 和 特征 ,彼此 间 难 于 分 类 ,这 些 都 统称 为 进化 计算 方法 。 目 前 ， 
进化 计算 被 广泛 运用 于 许多 复杂 系统 的 自 适应 控制 和 复杂 优化 问题 等 研究 领域 ,如 并 行 
计算 、 机 器 学 习 、 电 路 设计 、 神 经 网 络 、 基 于 Agent 的 仿真 .元 胞 自动 机 等 。 

达尔 文 进化 论 是 一 种 鲁 棒 的 搜索 和 优化 机 制 ,对 计算 机 科学 ,特别 是 对 人 工 智 能 的 发 
展 产生 了 很 大 的 影响 。 大 多 数 生物 体 通过 自然 选择 和 有 性 生殖 进行 进化 。 自 然 选择 决定 
了 群体 中 哪些 个 体能 够 生存 和 繁殖 ,有 性 生殖 保证 了 后 代 基 因 中 的 混合 和 重组 。 自 然 选 
择 的 原则 是 适 者 生存 , 即 物 竞 天 择 ,优胜 劣 汰 。 

自然 进化 的 这 些 特 征 早 在 20 世纪 60 年 代 就 引起 了 美国 Holland 的 极 大 兴趣 。 在 此 
期 间 , 他 和 他 的 学 生 们 从 事 如 何 建立 机 器 学 习 的 研究 。Holland 注意 到 ,学 习 不 仅 可 以 通 
过 单个 生物 体 的 适应 实现 ,而 且 可 以 通过 一 个 种 群 的 多 代 进 化 适应 实现 。 受 达尔 文 进化 
论 思 想 的 影响 ,他 逐渐 认识 到 在 机 器 学 习 中 ,为 获得 一 个 好 的 学 习 算法 , 仅 靠 单个 策略 的 
建立 和 改进 是 不 够 的 ,还 要 依赖 一 个 包含 许多 候选 策略 的 群体 的 繁殖 。 他 还 认识 到 ,生物 
的 自然 遗传 现象 与 人 工 自 适应 系统 行为 的 相似 性 ,因此 提出 在 研究 和 设计 人 工 自 主 系统 
时 可 以 模仿 生物 自然 遗传 的 基本 方法 。20 世纪 70 年 代 初 ,Holland 提出 了 “模式 理论 ”， 
并 于 1975 年 出 版 了 《自然 系统 与 人 工 系统 的 自 适 应 }》 专 著 , 系 统 地 阐述 了 遗传 算法 的 基本 
原理 ,奠定 了 遗传 算法 研究 的 理论 基础 。De Jong 的 论文 (一 类 遗传 适应 系统 的 行为 分 
析 》 把 Holland 的 模式 理论 与 自己 的 实验 结合 起 来 ,对 遗传 算法 的 发 展 和 应 用 产生 了 很 大 
影响 。Koza 把 遗传 算法 用 于 最 优 计算 机 程序 设计 ( 即 最 优 控 制 策 略 ) ,创立 了 遗传 编程 。 

进化 规划 是 由 Fogel 等 人 于 20 世纪 60 年 代 提 出 来 的 。 该 方法 认为 智能 行为 必须 具 
有 预测 环境 的 能 力 和 在 一 定 目 标 指导 下 对 环境 做 出 合理 响应 的 能 力 。 进 化 规划 采用 有 限 
字符 集 的 符号 序列 表示 所 模拟 的 环境 ,用 有 限 状 态 机 表示 智能 系统 。 它 不 像 遗 传 算法 那 
样 注重 父 代 与 子 代 的 遗传 细节 上 的 联系 ,而 是 把 重点 放 在 父 代 与 子 代表 现行 为 的 联系 上 。 

进化 策略 差不多 与 进化 规划 同时 由 德国 人 Rechenburg 和 Schwefel 提出 。 他 们 在 进 
行 风 洞 实验 时 ,随机 调整 气流 中 物体 的 最 优 外 形 参数 并 测试 其 效果 ,产生 了 进化 策略 的 
思想 。 

遗传 算法 、 进 化 规划 、 进 化 策略 这 3 个 领域 的 研究 相互 交流 ,并 发 现 它 们 的 共同 理论 
基础 是 生物 进化 论 。 因 此 ,把 这 3 种 方法 统称 为 进化 计算 ,而 把 相应 的 算法 称 为 进化 
算法 。 

在 新 型 最 优化 算法 中 ,有 一 类 算法 的 基础 是 群体 智能 (Swarm Intelligence, SI)。SI 
的 设计 思想 是 : 群体 (蚂蚁 和 蜜蜂 等 ) 中 的 有 机 个 体 根据 区 域 信息 、 行 为 主体 (agent) 之 间 
的 交流 及 其 自身 环境 做 出 的 决定 ,是 群体 智慧 (collective intelligence) 或 社会 智慧 (social 
intelligence) 的 起 源 。 算 法 类 型 包括 : 蚁 群 优化 算法 (Ant colony optimization) 、 蜂 群 优化 
算法 (Bee colony optimization)、 蝙 蝠 算法 (Bat algorithm)、 布 谷 鸟 搜索 算法 (cuckoo 
search) ,粒子 群 优化 算法 (Particle swarm optimization) \ 草 火 虫 算法 (Firefly algorithm) 、 
花 朱 授粉 算法 (Flower pollination algorithm)。 其 他 这 类 算法 还 有 很 多 , 如 引力 
(gravitational) 、 和 声 (harmony) 、 狼 群 (wolf) 搜 索 算法 ,以 及 以 生物 地 理学 和 免疫 系统 为 
基础 的 最 优化 算法 。 

6. 遗传 算法 

遗传 算法 是 模拟 自然 界 中 按 “ 优 胜 劣 汰 ”法 则 进行 进化 过 程 而 设计 的 算法 。 
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1967 年 ,Bagley 和 Rosengerg 在 他 们 的 博士 论文 中 提出 遗传 算法 的 概念 。1975 年 ， 
Holland 出 版 专著 奠定 了 遗传 算法 的 理论 基础 。 

20 世纪 80 年 代 初 ,Bethke 利用 WALSH 函数 和 模式 变换 方法 设计 了 一 个 确定 模式 
的 均值 的 有 效 方法 ,大 大 推进 了 对 遗传 算法 的 理论 研究 工作 。 

1987 年 , Holland 推广 了 Bethke 的 方法 。 如 今 , 遗 传 算法 不 但 给 出 了 清晰 的 算法 的 
描述 ,而 且 也 建立 了 一 些 定量 分 析 的 结果 ,并 在 各 方面 得 到 应 用 。 

遗传 算法 在 众多 领域 得 到 广泛 的 应 用 ,如 用 于 控制 (煤气 管道 的 控制 )、 规 划 ( 生 产 任 
务 规划 ) ,设计 (通信 和 网络 设计 ) ,组 合 优 化 (TSP 问题 ,背包 问题 ) 以 及 图 像 处 理 和 信号 处 
理 等 ,引起 人 们 极 大 的 兴趣 。 

遗传 算法 的 优点 是 : 适应 性 强 , 除 需 知 其 适应 性 函数 外 , 它 几 乎 不 需要 其 他 的 先 验 知 
识 , 故 能 在 不 同 的 广泛 领域 中 得 到 应 用 。 但 反 过 来 看 , 正 因为 它 利 用 先 验 知识 少 , 不 能 做 
到 “具体 问题 具体 分 析 ”, 故 一 般 ( 如 用 在 优化 中 ) 能 较 快 地 求 得 一 个 比较 好 的 解 , 但 要 求 得 
一 个 精确 的 解 ,就 非常 难 。 它 长 于 全 局 搜索 , 短 于 局 部 搜索 。 一 般 必须 与 其 他 方法 相 结 
合 ,取长补短 , 方 能 得 到 比较 满意 的 结果 。 

7. 数据 挖掘 与 知识 发 现 

知识 获取 是 知识 信息 处 理 的 关键 问题 之 一 。20 世纪 80 年 代 , 人 们 在 知识 发 现 方面 
取得 了 一 定 的 进展 。 利 用 样本 ,通过 归纳 学 习 , 或 者 与 神经 计算 结合 起 来 进行 知识 获取 已 
有 一 些 试验 系统 。 数 据 挖掘 和 知识 发 现 是 20 世纪 90 年 代 初 期 新 崛起 的 一 个 活跃 的 研究 
领域 。 在 数据 库 基 础 上 实现 的 知识 发 现 系统 ,通过 综合 运用 统计 学 、. 粗 糙 集 .模糊 数学 .机 
器 学 习 和 专家 系统 等 多 种 学 习 手 段 和 方法 ,从 大 量 的 数据 中 提炼 出 抽象 的 知识 ,从 而 揭示 
出 蕴涵 在 这 些 数据 背后 的 客观 世界 的 内 在 联系 和 本 质 规律 ,实现 知识 的 自动 获取 。 这 是 
一 个 富有 挑战 性 的 ,并 具有 广阔 应 用 前 景 的 研究 课题 。 

从 数据 库 获 取 知识 , 即 从 数据 中 挖掘 并 发 现 知识 ,首先 要 解决 被 发 现 知识 的 表达 问 
题 。 最 好 的 表达 方式 是 自然 语言 ,因为 它 是 人 类 的 思维 和 交流 语言 。 知 识 表示 的 最 根本 
问题 就 是 如 何 形成 用 自然 语言 表达 的 概念 。 概 念 比 数据 更 确切 、 更 直接 、 更 易于 理解 。 自 
然 语 言 的 功能 就 是 用 最 基本 的 概念 描述 复杂 的 概念 ,用 各 种 方法 对 概念 进行 组 合 ,以 表示 
所 认 知 的 事件 , 即 知 识 。 

机 器 知识 发 现 始 于 1974 年 。 到 20 世纪 80 年 代 末 , 数 据 挖掘 取得 突破 。 美 国 总 统 信 
息 技 术 顾 问 委 员 会 的 报告 指出 ,信息 技术 领域 中 创造 10 亿美 元 以 上 产值 的 主要 是 关系 数 
据 库 和 并 行 数据 库 的 数据 挖掘 技术 。 

大 规模 数据 库 和 互联 网 的 迅速 增长 ,使 人 们 对 数据 库 的 应 用 提出 新 的 要 求 。 仅 用 查 
询 检索 已 不 能 提取 数据 中 有 利于 用 户 实 现 其 目标 的 结论 性 信息 。 数 据 库 中 包含 的 大 量 知 
识 无 法 得 到 充分 的 发 掘 与 利用 ,会 造成 信息 的 浪费 ,并 产生 大 量 的 数据 垃圾 。 另 一 方面 ， 
知识 获取 仍 是 专家 系统 研究 的 瓶颈 问题 。 从 领域 专家 获取 知识 是 非常 复杂 的 个 人 到 个 人 
之 间 的 交互 过 程 , 具 有 很 强 的 个 性 和 随机 性 ,没有 统一 的 办 法 。 因 此 ,人 们 开始 考虑 以 数 
据 库 作为 新 的 知识 源 。 数 据 挖掘 和 知识 发 现 能 够 自动 处 理 数 据 库 中 大 量 的 原始 数据 , 抽 
取出 具有 必然 性 的 .富有 意义 的 模式 ,帮助 人 们 找到 问题 的 解答 。 数 据 库 中 的 知识 发 现 具 
有 4 个 特征 , 即 发 现 的 知识 用 高 级 语言 表示 ;发 现 的 内 容 是 对 数据 内 容 的 精确 描述 ;发 现 
的 结果 ( 即 知识 ) 是 用 户 感 兴趣 的 ;发 现 的 过 程 应 是 高 效 的 。 
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比较 成 功 的 .典型 的 知识 发 现 系统 有 用 于 超级 市 场 商品 数据 分 析 、 解 释 和 报告 的 
CoverStory 系统 ;用 于 概念 性 数据 分 析 和 查询 感 兴趣 关系 的 集成 化 系统 EXPLORA; 交 
互 式 大 型 数据 库 分 析 工 具 KDW ;用 于 自动 分 析 大 规模 天 空 观测 数据 的 SKICAT 系统 ; 通 
用 的 数据 库 知识 发 现 系 统 KDD 等 。 


1.4.4 智能 行动 


1. 智能 检索 

对 国内 外 种 类 繁多 和 数量 巨大 的 科技 文献 之 检索 远 非 人 力 和 传统 检索 系统 所 能 胜 
任 。 研 究 智 能 检索 系统 已 成 为 科技 持续 快速 发 展 的 重要 保证 。 

智能 信息 检索 系统 的 设计 者 们 将 面临 以 下 儿 个 问题 。 首 先 ,如 何 建立 一 个 能 够 理解 
以 自然 语言 陈述 的 询问 系统 。 其 次 ,如 何 根据 存储 的 事实 演绎 出 答案 。 最 后 ,如 何 表示 和 
应 用 常识 问题 ,因为 理解 询问 和 演绎 答案 需要 的 知识 都 有 可 能 超出 该 学 科 领 域 数 据 库 表 
示 的 知识 范围 。 

2. 智能 调度 与 指挥 

确定 最 佳 调 度 或 组 合 的 问题 是 人 们 感 兴趣 的 又 一 类 问题 。 一 个 古典 的 问题 就 是 推销 
员 旅 行 问 题 。 这 个 问题 要 求 为 推销 员 寻 找 一 条 最 短 的 旅行 路 线 。 他 从 某 个 城市 出 发 , 访 
问 每 个 城市 一 次 , 且 只 允许 一 次 ,然后 回 到 出 发 的 城市 。 这 个 问题 的 一 般 提 法 是 : 对 由 
个 结 点 组 成 的 一 个 图 的 各 条 边 ,寻找 一 条 最 小 代价 的 路 径 ,使 得 这 条 路 径 对 个 结 点 的 每 
个 点 只 允许 穿 过 一 次 。 试 图 求解 这 类 问题 的 程序 产生 了 一 种 组 合 爆炸 的 可 能 性 。 这 些 问 
题 多 数 属于 NP-hard 问题 。 

人 工 智能 学 家 们 曾经 研究 过 若干 组 合 问题 的 求解 方法 。 他 们 的 努力 集中 在 使 “时 间 - 
问题 大 小 ”曲线 的 变化 尽 可 能 缓慢 地 增长 ,即使 是 必须 按 指数 方式 增长 。 有 关 问 题 域 的 知 
识 再 次 成 为 比较 有 效 的 求解 方法 的 关键 。 为 了 处 理 组 合 问题 而 发 展 起 来 的 许多 方法 对 其 
他 组 合 上 不 甚 严重 的 问题 也 是 有 用 的 。 

智能 组 合 调 度 与 指挥 方法 已 被 应 用 于 汽车 运输 调度 ,列车 的 编组 与 指挥 .空中 交通 管 
制 以 及 军事 指挥 等 系统 。 它 已 引起 有 关 部 门 的 重视 。 其 中 ,军事 指挥 系统 已 从 CI 


(Command,Control,Communication and Intelligence) 发 展 为 C!ISRCCommand,Control， 





Communication ,Computer,Intelligence,Surveillance and Reconnaissance) , 即 在 CI 的 基 
础 上 增加 了 侦察 ,信息 管理 和 信息 战 ,强调 战场 情报 的 感知 能 力 、 信 息 综合 处 理 能 力 以 及 
系统 之 间 的 交互 作用 能 力 。 

下 面 介 绍 任务 规划 系统 O-Plan。O-Plan 是 爱丁堡 大 学 开发 的 一 个 规划 系统 , 它 是 一 
个 基于 规则 的 规划 器 。 该 规划 器 使 用 规划 的 层次 表示 ,任务 可 以 展开 成 更 多 的 细节 层次 ; 
可 以 用 不 同 的 方法 把 高 层次 的 规划 展开 成 低层 次 的 规划 ,规划 器 搜索 可 选择 规划 产生 方 
式 , 规 划 中 不 同 部 分 的 解 可 能 包含 检测 与 纠正 的 相互 作用 ; 结 点 的 网 络 表示 规划 的 不 同 层 
次 ,这 种 表示 形式 允许 将 关于 时 间 与 资源 约 东 的 知识 用 于 约 东 对 解 的 搜索 。 

O-Plan 已 经 被 开发 了 许多 年 ,是 富 于 知识 的 规划 器 的 一 个 很 好 的 例子 。O-Plan 已 经 
应 用 于 许多 现实 世界 的 问题 ,其 中 一 些 如 下 : 空间 站 构造 .卫星 规划 与 控制 、 结 构 构 造 与 
房屋 建造 .软件 开 发 .UNIX 管理 员 的 手迹 写 入 物流 、 非 战斗 撤退 行动 .危机 响应 、 空 战 规 
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划 流 程 。 

3. 智能 控制 

智能 控制 是 驱动 智能 机 器 自主 地 实现 其 目标 的 过 程 。 许 多 复杂 的 系统 难以 建立 有 效 
的 数学 模型 和 用 常规 控制 理论 进行 定量 计算 与 分 析 , 而 必须 采用 定量 数学 解析 法 与 基于 
知识 的 定性 方法 的 混合 控制 方式 。 随 着 人 工 智 能 和 计算 机 技术 的 发 展 , 已 有 可 能 把 自动 
控制 和 人 工 智能 以 及 系统 科学 的 某 些 分 支 结合 起 来 ,建立 一 种 适用 于 复杂 系统 的 控制 理 
论 和 技术 。 

智能 控制 是 同时 具有 以 知识 表示 的 非 数 学 广义 世界 模型 和 数学 公式 模型 表示 的 混合 
控制 过 程 , 也 往往 是 含有 复杂 人性、 不 完全 人性、 模糊 性 或 不 确定 性 以 及 不 存在 已 知 算法 的 非 
数学 过 程 ,并 以 知识 进行 推理 ,以 启发 引导 求解 过 程 。 因 此 ,在 研究 和 设计 智能 控制 系统 
时 ,不 把 注意 力 放 在 数学 公式 的 表达 、 计 算 和 处 理 方面 ,而 是 放 在 对 任务 和 世界 模型 的 描 
述 、 对 符号 和 环境 的 识别 以 及 对 知识 库 和 推理 机 的 设计 开发 上 , 即 放 在 智能 机 模型 上 。 智 
能 控制 的 核心 在 高 层 控制 , 即 组 织 级 控制 。 其 任务 在 于 对 实际 环境 或 过 程 进行 组 织 , 即 决 
策 和 规划 ,以 实现 广义 问题 的 求解 。 已 经 提出 的 用 以 构造 智能 控制 系统 的 理论 和 技术 有 
分 级 递 阶 控制 理论 .分 级 控制 器 设计 的 焙 方 法 、 智 能 逐 级 增高 而 精度 逐 级 降低 原理 .专家 
控制 系统 .学习 控制 系统 和 神经 控制 系统 等 。 

智能 控制 有 很 多 研究 领域 ,它们 的 研究 课题 既 具 有 独立 性 ,又 相互 关联 。 目 前 研究 得 
较 多 的 是 以 下 6 个 方面 : 智能 机 器 人 规划 与 控制 .智能 过 程 规划 、 智 能 过 程控 制 .专家 控 
制 系统 .语音 控制 以 及 智能 仪器 。 

下 面 以 宇宙 飞船 的 自主 控制 为 例 , 介 绍 智能 控制 。1998 年 10 月 24 日 ,宇宙 飞船 深 
空 1 号 从 Canaveral 角 发 射 升 空 。 飞 行 的 目的 是 测试 12 项 先进 的 高 风险 技术 。 飞 行 的 
成 功 使 其 使 命 延 长 , 深 空 1 号 最 终 在 2001 年 12 月 18 日 退役 。 深 空 1 号 上 的 软件 实验 象 
征 着 向 将 来 宇宙 飞船 的 自主 控制 前 进 了 一 大 步 。 该 软件 就 是 称 为 远程 代理 (Remote 
Agent,RA) 的 一 个 人 工 智能 系统 , 它 能 够 规划 和 控制 宇宙 飞船 的 活动 。 

为 使 宇宙 飞船 执行 一 项 任务 ,如 为 自己 定位 ,以 获取 小 行星 的 照片 ,通常 的 方法 是 由 
地 面 上 的 一 组 人 员 规划 出 一 系列 控制 命令 并 发 送 给 宇宙 飞船 。RA 能 够 设计 自己 的 规 
划 , 以 响应 一 个 高 级 目标 ,如 “在 下 个 星期 对 下 列 小 行星 拍照 并 延长 90% 的 时 间 ”。 规 划 
指出 满足 目标 的 一 系列 动作 。 每 个 动作 由 任务 表示 ,任务 分 解 成 更 细 的 任务 ,直到 最 后 每 
个 任务 都 是 飞行 软件 能 够 执行 的 指令 为 止 。 为 此 ,MA 配备 有 支持 通常 船上 控制 软件 的 
知识 和 地 面 控制 人 员 使 用 的 知识 ,有 飞行 目标 的 知识 、 对 飞船 硬件 的 认识 ,以 及 宇宙 飞船 
运行 环境 的 知识 。 

4. 人 机 对 话 系 统 

在 人 机 对 话 系统 领域 , 某 些 相对 垂直 的 方面 已 经 获得 了 足够 多 的 数据 ,如 客服 和 汽车 
(车 内 的 人 车 对 话 ) 方 面 ; 还 有 一 种 是 特定 场景 的 特定 任务 ,如 Amazon Echo, 你 可 以 和 它 
讲话 ,可 以 说 “你 给 我 放 首 歌 吧 ” 或 者 “你 播放 一 下 新 闻 ”.Amazon Echo 里 面 有 多 个 麦克 
风 形 成 的 阵列 , 围 成 一 圈 , 这 个 阵列 可 以 探测 到 人 是 否 在 和 它 说 话 , 如 我 把 脸 转 过 去 和 别 
人 说 话 的 时 候 , 它 就 不 会 有 反应 ,并 且 大 规模 地 降低 噪声 。 利 用 了 硬件 的 优势 ,在 家 庭 这 
个 场景 中 ,这 种 “唤醒 功能 "是 非常 准确 的 。 它 的 另 一 个 功能 是 当 你 的 双手 无 法 控制 手机 
的 时 候 ,可 以 用 语音 控制 ,案例 场景 是 客厅 和 厨房 ,在 美国 ,Amazon Echo 特别 受 家 庭 主 
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妇 的 欢迎 。 虽 然 它 现在 只 有 一 问 一 答 的 形式 ,但 有 了 准确 的 唤醒 功能 以 后 ,给 人 的 印象 就 
好 像 它 可 以 进行 多 轮 问答 的 复杂 对 话 。 所 以 , 当 有 了 人 工 智能 应 用 的 特定 场景 ,如 果 收 集 
了 足够 多 .足够 好 的 数据 ,是 可 以 训练 出 强大 的 对 话 系统 的 。 

5. 智能 机 器 人 

智能 机 器 人 是 具有 人 类 特有 的 某 种 智能 行为 的 机 器 。 

一 般 认 为 ,按照 机 器 人 从 低级 到 高 级 的 发 展 程度 ,可 以 把 机 器 人 分 为 三 代 。 第 一 代 机 
器 人 , 即 工业 机 器 人 ,主要 指 只 能 以 * 示 教 -再 现 ? 方 式 工作 的 机 器 人 。 这 类 机 器 人 的 本 体 
是 一 只 类 似 于 人 的 上 肢 功 能 的 机 械 手 臂 ,未 端 是 手 扑 等 操作 机 构 。 第 二 代 机 器 人 是 指 基 
于 传感器 信息 工作 的 机 器 人 。 它 依靠 简单 的 感觉 装置 获取 作业 环境 和 对 象 的 简单 信息 ， 
通过 对 这 些 信息 的 分 析 、 处 理 做 出 一 定 的 判断 ,对 动作 进行 反馈 控制 。 第 三 代 机 器 人 , 即 
智能 机 器 人 ,这 是 一 类 具有 高 度 适应 性 的 有 一 定 自主 能 力 的 机 器 人 。 它 本 身 能 感知 工作 
环境 、 操 作对 象 及 其 状态 ;能 接受 、 理 解 人 给 予 的 指令 ,并 结合 自身 认识 外 界 的 结果 独立 地 
决定 工作 规划 ,利用 操作 机 构 和 移动 机 构 实 现任 务 目 标 ;还 能 适应 环境 的 变化 ,调整 自身 
行为 。 

区 别 于 第 一 代 、 第 二 代 机 器 人 ,智能 机 器 人 必须 具备 4 种 机 能 : 行动 机 能 一 一 施加 于 
外 部 环境 和 对 象 的 ,相当 于 人 的 手 、 足 的 动作 机 能 ;感知 机 能 一 一 获取 外 部 环境 和 对 象 的 
状态 信息 ,以 便 进行 自我 行为 监视 的 机 能 ;思维 机 能 一 一 求解 问题 的 认 知 推理、 记忆 判 
断 、 决 策 .学习 等 机 能 ;人 机 交互 机 能 一 一 理解 指示 命令 、 输 出 内 部 状态 ,与 人 进行 信息 交 
换 的 机 能 。 简 言 之 ,智能 机 器 人 的 “智能 "特征 就 在 于 它 具 有 与 外 部 世界 一 一 环境 、 对 象 和 
人 相 协 调 的 工作 机 能 。 

围绕 上 述 4 种 机 能 ,智能 机 器 人 的 主要 研究 内 容 有 : 操作 与 移动 .传感器 及 其 信息 处 
理 、 控 制 、 人 机 交互 .体系 结构 .机 器 智能 和 应 用 研究 。 

目前 ,智能 机 器 人 的 研究 还 处 于 初级 阶段 ,研究 目标 一 般 围 绕 感知 ` 行 动 .思考 3 个 问 
题 。 实 验 室 原 型 主要 有 : 自动 装配 机 器 人 、 移 动 式 机 器 人 和 水 下 机 器 人 。 

智能 机 器 人 的 研究 目前 正在 3 个 方面 深入 ,依靠 人 工 智能 基于 领域 知识 的 成 熟 技 术 ， 
发 展 面向 专门 任务 的 特种 机 器 人 ;在 研制 各 种 新 型 传感器 的 同时 ,发展 基于 多 传感器 集成 
的 大 量 信息 获取 和 实时 处 理 技术 ;改变 排除 人 的 参与 ,机 器 人 完全 自主 的 观念 ,发 展 人 机 
一 体 化 的 智能 系统 。 

智能 机 器 人 的 研究 和 应 用 体现 出 广泛 的 学 科 交叉 ,涉及 众多 的 课题 ,如 机 器 人 体系 结 
构 、 机 构 、 控 制 、 知 能、 视觉. 触觉 力 觉 . 听 觉 . 机 器 人 装配 、 恶 劣 环 境 下 的 机 器 人 以 及 机 器 
人 语言 等 。 机 器 人 已 在 各 种 工业 、 农 业 、 商 业 、 旅 游 业 、 空 中 和 海洋 以 及 国防 等 领域 得 到 越 
来 越 普遍 的 应 用 。 

星际 探索 机 器 人 能 够 飞 往 遥 远 的 不 宜人 类 生存 的 太空 ,进行 人 类 难以 或 无 法 胜任 的 
星球 和 宇宙 探测 。1997 年 ,美国 研制 的 探 路 者 (pathfinder) 空 间 移动 机 器 人 完成 了 对 火 
星 表面 的 实地 探测 ,取得 大 量 有 价值 的 火星 资料 ,为 人 类 研究 与 利用 火星 做 出 了 贡献 ,被 
誉 为 20 世纪 自动 化 技术 的 最 高 成 就 之 一 。 能 够 在 宇宙 空间 作业 的 空间 机 器 人 ,已 成 为 空 
间 开 发 的 重要 组 成 部 分 。 

海洋 (水 下 ) 机 器 人 是 海洋 考察 和 开发 的 重要 工具 。 用 新 技术 装备 起 来 的 机 器 人 将 广 
泛 用 于 海洋 考察 ,水 下 工程 (如 海底 隧道 建筑 海底 探矿 和 采矿 等 ) .打捞 救助 和 军事 活动 
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等 方面 。 现 在 ,海洋 机 器 人 的 潜 海 深度 可 达 12000m 以 上 。 

机 器 人 外 科 手 术 系统 已 成 功 地 用 于 脑 外 科 、 胸 外 科 和 膝 关 节 等 手术 。 机 器 人 不 仅 参 
与 辅助 外 科 手 术 , 而 且 能 够 直接 为 病人 开刀 ,还 将 全 面 参与 远程 医疗 服务 。 

微型 机 器 人 是 21 世纪 的 尖端 技术 之 一 。 已 经 开发 出 手指 大 小 的 微型 移动 机 器 人 ,可 
进入 小 型 管道 进行 检查 作业 。 预 计 在 不 久之 后 将 要 生产 出 毫米 级 大 小 的 微型 机 器 人 和 直 
径 为 几 百 微米 甚至 更 小 的 纳米 级 医疗 机 器 人 ,让 它们 直接 进入 人 体 器 官 ,进行 各 种 疾病 的 
诊断 和 治疗 ,而 不 伤害 人 的 健康 。 微 型 机 器 人 在 精密 机 械 加 工 、 现 代 光 学 仪器 、 超 大 规模 
集成 电路 .现代 生物 工程 .遗传 工程 .医学 和 医疗 等 工程 中 ,大 有 用 武之 地 。 

智能 机 器 人 已 广泛 应 用 于 体育 和 娱乐 领域 。 其 中 ,足球 机 器 人 和 机 器 人 足球 比赛 , 集 
高 新 技术 和 娱乐 比赛 于 一 体 , 是 科技 理论 与 实际 密切 结合 的 极 富生 命 力 的 成 长 点 ,已 引起 
社会 的 普遍 重视 和 各 界 的 极 大 兴趣 。 足 球 机 器 人 系统 涉及 计算 机 视觉 (尤其 是 彩色 视 
觉 ) ,移动 通信 和 和 网络、 多 智能 体 、 机 电 一 体 化 ,动态 协调 和 决策 、 计 算 机 实时 仿真 、 人 工 智 
能 和 智能 控制 以 及 控制 硬件 .软件 和 智能 的 集成 等 技术 ,能 够 反映 出 一 个 国家 信息 和 自动 
化 技术 的 综合 实力 。 

人 机 交互 的 智能 客服 会 产生 很 多 外 界 公 开 的 数据 以 及 内 部 的 数据 .知识 库 等 。 这 些 
数据 都 可 以 用 来 制造 机 器 人 ,尤其 是 可 以 用 过 去 的 数据 做 训练 。 这 个 数据 量 在 垂直 领域 
逐渐 增加 。 现 在 的 对 话 系统 也 已 逐渐 成 为 深度 学 习 和 强化 学 习 的 焦点 。 在 客服 需求 量 
大 ,而 服务 内 容 垂直 的 应 用 领域 ,对 话 系统 会 发 挥 巨大 作用 。 

在 21 世纪 ,人 类 必须 学 会 与 机 器 人 打交道 。 越 来 越 多 的 机 器 人 保姆 .机 器 人 司机 、 机 
器 人 秘书 、 机 器 人 节目 主持 人 以 及 网 络 机 器 人 、 虚 拟 机 器 人 、 人 形 机 器 人 、 军 事 机 器 人 等 将 
推广 应 用 ,成 为 机 器 人 学 新 篇 章 的 重要 音符 和 旋律 。 

6. 分 布 式 人 工 智能 与 Agent 

分 布 式 人 工 智能 (Distributed AI,DAD 是 分 布 式 计算 与 人 工 智能 结合 的 结果 。DAI 
系统 以 鲁 棒 性 作为 控制 系统 质量 的 标准 ,并 具有 互 操作 性 , 即 不 同 的 异 构 系 统 在 快速 变化 
的 环境 中 具有 交换 信息 和 协同 工作 的 能 力 。 

分 布 式 人 工 智能 的 研究 目标 是 要 创建 一 种 能 够 描述 自然 系统 和 社会 系统 的 精确 概念 
模型 。DAI 中 的 智能 并 非 独立 存在 的 概念 ,只 能 在 团体 协作 中 实现 ,因而 其 主要 研究 问 
题 是 各 Agent 之 间 的 合作 与 对 话 , 包 括 分 布 式 问题 求解 和 多 Agent 系统 (MultiAgent 
System,MAS) 两 个 领域 。 其 中 ,分布 式 问题 求解 把 一 个 具体 的 求解 问题 划分 为 多 个 相互 
合作 和 知识 共享 的 模块 或 结 点 。 多 Agent 系统 则 研究 各 Agent 之 间 智 能 行为 的 协调 , 包 
括 规划 、 知 识 、 技 术 和 动作 的 协调 。 这 两 个 研究 领域 都 要 研究 知识 、 资 源 和 控制 的 划分 问 
题 ,但 分 布 式 问 题 求解 往往 含有 一 个 全 局 的 概念 模型 .问题 和 成 功 标准 ,而 MAS 则 含有 
多 个 局 部 的 概念 模型 .问题 和 成 功 标准 。 

MAS 更 能 体现 人 类 的 社会 智能 ,具有 更 大 的 灵活 性 和 适应 性 ,更 适合 开放 和 动态 的 
世界 环境 ,因而 备 受 重视 ,已 成 为 人 工 智能 ,以 至 计算 机 科学 和 控制 科学 与 工程 的 研究 热 
点 。 当 前 ,Agent 和 MAS 的 研究 包括 Agent 和 MAS 理论 ,体系 结构 ,语言 .合作 与 协调 、 
通信 和 交互 技术 、MAS 学 习 和 应 用 等 。MAS 已 在 自动 驾驶 、 机 器 人 导航 、 机 场 管理 .电力 
管理 和 信息 检索 等 方面 得 到 应 用 。 

完全 自主 Agents 的 4 个 主要 应 用 领域 分 别 是 : 足球 机 器 人 (robot soccer) 无 人 驾驶 
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车 辆 (autonomous vehicles); 拍卖 Agents (bidding agents); 自主 计算 (autonomic 
computing) 。 其 中 ,足球 机 器 人 和 无 人 驾驶 车 辆 属于 “物理 Agents”(physical agents) , 拍 
卖 Agents 和 自主 计算 属于 “软件 Agents”。 这 些 应 用 充分 展示 了 机 器 学 习 与 多 Agents 
推理 的 紧密 结合 , 它 涉 及 自 适应 及 层次 表达 、 分 层 学 习 、 迁 移 学 习 (transfer learning)、 自 
适应 交互 协议 Agent 建 模 等 关键 技术 。 

7. 人 工 生命 

人 工 生命 (Artificial Life, ALife) 的 概念 是 由 美国 圣 达 菲 研 究 所 非 线 性 研究 组 的 
Langton 于 1987 年 提出 的 , 旨 在 用 计算 机 和 精密 机 械 等 人 工 媒介 生成 或 构造 出 能 够 表现 
自然 生命 系统 行为 特征 的 仿真 系统 或 模型 系统 。 自 然 生 命 系统 行为 具有 自 组 织 . 自 复制 、 
自修 复 等 特征 ,以 及 形成 这 些 特 征 的 混浊 动力 学 .进化 和 环境 适应 。 

人 工 生 命 所 研究 的 人 造 系统 能 够 演示 具有 自然 生命 系统 特征 的 行为 ,在 "生命 之 所 
能 ”(life as it could be) 的 广阔 范围 内 深入 研究 “生命 之 所 知 ”(life as we know it) 的 实质 。 
只 有 从 “生命 之 所 能 ”的 广泛 内 容 考 察 生命 ,才能 真正 理解 生物 的 本 质 。 人 工 生命 与 生命 
的 形式 化 基础 有 关 。 生 物 学 从 问题 的 顶层 开始 ,考察 器 官 、 组 织 、 细 胞 、 细 胞 膜 ,直到 分 子 ， 
以 探索 生命 的 奥秘 和 机 理 。 人 工 生命 则 从 问题 的 底层 开始 ,把 器 官 作为 简单 机 构 的 宏观 
群体 考察 , 自 底 向 上 进行 综合 ,由 简单 的 被 规则 支配 的 对 象 构成 更 大 的 集合 ,并 在 交互 作 
用 中 研究 非 线 性 系统 的 类 似 生命 的 全 局 动力 学 特性 。 

人 工 生命 的 理论 和 方法 有 别 于 传统 人 工 智能 和 神经 网 络 的 理论 和 方法 。 人 工 生命 通 
过 计算 机 仿真 生命 现象 所 体现 的 自 适 应 机 理 , 对 相关 非 线性 对 象 进行 更 真实 的 动态 描述 
和 动态 特征 研究 。 

人 工 生命 学 科 的 研究 内 容 包括 生命 现象 的 仿生 系统 .人 工 建 模 与 仿真 .进化 动力 学 、 
人 工 生命 的 计算 理论 .进化 与 学 习 综合 系统 以 及 人 工 生命 的 应 用 等 。 比 较 典 型 的 人 工 生 
命 研 究 有 计算 机 病毒 .计算 机 进程 .进化 机 器 人 、 自 催化 网 络 、 细 胞 自动 机 .人 工 核 背 酸 和 
人 工 脑 等 。 

8. 游戏 

对 于 游戏 开发 者 来 说 ,人 工 智能 最 终 意 味 着 广泛 的 技术 范围 。 这 些 技术 可 用 于 生成 
对 手 ,战场 上 的 部 队 、 队 友 , 非 玩 家 角色 或 游戏 中 一 切 模拟 智能 的 行为 。 其 中 一 些 技术 ,如 
有 限 状 态 机 和 启发 式 A* 搜索 算法 ,多 年 以 来 已 经 在 许多 游戏 中 得 到 了 有 效 验证 。 在 最 
基本 层 ,游戏 中 的 有 限 状 态 机 包括 以 下 3 部 分 : 一 个 角色 在 游戏 中 可 能 有 的 几 种 状态 ; 
加 决定 何 时 变换 状态 的 一 组 条 件 ; 加 实现 每 种 状态 角色 行为 的 一 组 代码 。 

例如 光政 恶 的 外 星人 ?可 能 有 3 种 状态 : 搜寻 战斗 和 逃跑 。 在 战斗 状态 下 ,外 星人 
可 以 边 朝 玩家 移动 , 边 发 射 激光 炮 。 不 过 ,如 果 “ 外 星 复仇 女神 ”的 健康 指数 在 战斗 状态 时 
下 降 到 25% 以 下 , 则 人 物 就 会 转换 到 逃跑 状态 ,并 且 逃 回 母 舰 。 有 限 状 态 机 能 有 效 地 将 
人 物 整 组 的 行为 分 解 成 独立 部 分 , 且 各 部 分 之 间 转 换 的 迎 辑 是 简单 的 。 然 而 , 随 着 角色 行 
为 复杂 性 的 增加 ,其 状态 数 可 能 会 出 现 爆炸 。 

在 这 些 例子 中 ,人 工 智能 控制 的 外 星人 会 朝 玩家 移动 进行 战斗 ,或 逃离 玩家 。 在 虚拟 
环境 中 绕 过 围墙 和 其 他 障碍 物 时 ,这 两 种 行为 都 要 求 游戏 的 人 工 智 能 技术 计算 出 一 条 从 
外 星人 当前 位 置 到 最 佳 攻击 点 的 路 径 。 路 径 规划 是 游戏 智能 中 最 常见 的 具有 挑战 性 问题 
这 三 
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当 人 工 智 能 控制 的 一 队 士 兵 必 须 移动 到 一 个 攻击 点 ,或 者 人 工 智 能 控制 的 橄榄 球 “ 跑 
卫 " 跑 向 前 场 ,或 者 当 人 工 智 能 控制 的 队友 跟随 玩家 穿越 迷宫 的 房屋 和 门 时 ,都 要 用 到 路 
径 规 划 技 术 。 

A* 搜索 算法 为 大 多 数 游戏 如 何 计算 人 工 智能 角色 从 A 点 运动 到 BB 点 的 路 径 提供 了 
基础 。A* 搜索 方法 维护 着 一 张 部 分 路 径 的 列表 ,并 根据 目前 探索 出 的 路 径 长 度 和 到 达 目 
标的 估计 距离 的 最 短路 径 组 合 ,不 断 扩展 已 有 的 局 部 路 径 。 

在 一 定 条 件 下 ,A 搜索 是 一 种 理论 最 优 搜 索 算法 。 但 是 ,由 于 游戏 开发 者 能 紧密 控 
制 游戏 场景 ,因而 可 以 发 现 , 若 干 A" 搜索 的 有 趣 的 变种 算法 尽管 从 理论 上 讲 速度 不 会 更 
快 ,但 是 解决 具体 游戏 中 的 路 径 规 划 问题 却 更 有 效 。 

多 年 来 ,路 径 规划 始终 是 游戏 产业 中 人 工 智能 专家 关注 的 主要 焦点 。 当 今 的 游戏 只 
使 用 可 用 处 理 能 力 的 一 小 部 分 ,就 能 计算 出 数 百 个 单元 的 路 径 , 留 出 大 量 资源 用 于 满足 其 
他 需求 。 

9. 人 机 智能 融合 

人 机 融合 智能 就 是 充分 利用 人 和 机 器 的 长 处 形成 一 种 新 的 智能 形式 。 人 处 理 其 擅长 
的 包含 “应 该 "(should) 等 价值 取向 的 主观 信息 ,机 器 则 计算 其 拿手 的 涉及 “是 ”(being) 等 
规则 概率 统计 的 客观 数据 ,进而 变 成 一 个 可 执行 、 可 操作 的 程序 性 问题 ,也 是 把 客观 数据 
与 主观 信息 统一 起 来 的 新 机 制 , 即 需要 意向 性 价值 的 时 候 由 人 处 理 , 需 要 形式 化 (数字 化 ) 
的 事实 时 候 由 机 器 分 担 ,从 而 产生 了 一 种 人 十 机 大 于 人 、 人 十 机 大 于 机 的 效果 。 

人 机 智能 融合 中 的 深度 态势 感知 是 一 个 重要 隘口 ,深度 态势 感知 的 含义 是 “对 态势 感 
知 的 感知 ,是 一 种 人 机 智慧 , 既 包 括 了 人 的 智慧 ,也 融合 了 机 器 的 智能 (人 工 智能 )”, 是 能 
指 十 所 指 , 既 涉及 事物 的 属性 (能 指 、 感 觉 ), 又 关联 它们 之 间 的 关系 (所 指 、 知 觉 ) , 既 能 够 
理解 事物 的 原本 之 意 , 也 能 够 明白 弦 外 之 音 。 它 是 在 以 Endsley 为 主体 的 态势 感知 (包括 
信息 输入 \ 处 理 、 输 出 环节 ?基础 上 ,加 上 人 、 机 ( 物 )、. 环 境 ( 自 然 . 社 会 ) 及 其 相互 关系 的 整 
体系 统 趋势 分 析 , 具 有 “ 软 / 硬 ” 两 种 调节 反馈 机 制 ; 既 包括 自 组 织 、 自 适应 ,也 包括 他 组 织 、 
互 适应 ; 既 包 括 局 部 的 定量 计算 预测 ,也 包括 全 局 的 定性 计算 评估 ,是 一 种 具有 自主 、 自 动 
弥 聚 效应 的 信息 修正 、 补 偿 的 期 望 -选择 -预测 -控制 体系 。 

Being 与 should 的 狭义 结合 就 是 数据 与 知识 ,结构 与 功能 \ 感 知 与 推理 直觉 与 逻辑 、 
联结 与 符号 、 属 性 与 关系 的 结合 ,也 是 未 来 智能 体系 的 发 展 趋势 ;其 广义 结合 是 意向 性 与 
形式 化 的 结合 。 临 界 是 一 种 介 于 有 序 和 无 序 之 间 的 状态 ,是 工作 效率 最 大 化 的 一 种 表现 
形式 。 人 机 融合 智能 就 是 要 寻找 到 这 种 平衡 状态 ,让 人 的 无 序 与 机 的 有 序 、 人 的 有 序 与 机 
的 无 序 相得益彰 ,达到 安全 、 高 效 、 敏 捷 的 结果 。 想 象 力 、 创 造 力 是 感性 与 理性 的 界面 ,也 
许 人 机 智能 的 融合 可 以 实现 一 定 程度 上 主客 观 、 感 性 与 理性 的 相互 适应 性 融合 。 


1.5 人 工 智能 发 展 展望 


1.5.1 新 一 轮 人 工 智能 的 发 展 特征 


当前 人 工 智 能 发 展 的 突飞猛进 和 重大 变化 ,表现 出 区 别 于 过 去 的 3 个 方面 的 阶段 性 
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1. 进入 大 数据 驱动 智能 发 展 阶段 

可 以 说 ,2000 年 之 后 成 熟 起 来 的 三 大 技术 成 就 了 人 工 智能 的 新 一 轮 发 展 高 潮 , 包 括 
以 深度 学 习 为 代表 的 新 一 代 机 器 学 习 模 型 ;GPU. 云 计算 等 高 性 能 并 行 计算 技术 应 用 于 
智能 计算 ,以 及 大 数据 的 进一步 成 熟 , 以 上 三 大 技术 构建 起 支撑 新 一 轮 人 工 智 能 高 速 发 展 
的 重要 基础 。 

DARPA 认为 ,人 工 智 能 发 展 将 经 历 3 个 波 次 。 第 一 波 次 是 人 工 智能 发 展 初期 的 基 
于 规则 的 时 代 , 专 家 们 会 基于 自己 掌握 的 知识 设计 算法 和 软件 ,这 些 AI 系统 通常 是 基于 
明确 而 又 符合 逻辑 的 规则 。 在 第 二 波 次 AI 系统 中 ,人 们 不 再 直接 教授 AI 系统 规则 和 知 
识 ,而 是 通过 开发 特定 类 型 的 机 器 学 习 模 型 ,基于 海量 数据 形成 智能 获取 能 力 ,深度 学 习 
是 其 典型 代表 。 在 这 种 技术 路 线 下 ,获得 高 质量 的 大 数据 和 高 性 能 的 计算 能 力 成 为 算法 
成 功 的 关键 要 素 。 例 如 ,2015 年 以 来 ,IBM 通过 收购 大 量 医疗 健康 领域 的 公司 ,获取 患者 
病例 、 医 疗 影像 和 临床 记录 等 医疗 数据 ,以 提升 Watson 医疗 诊断 水 平 。 

尽管 基于 现 有 的 深度 学 习 十 大 数据 的 方法 , 离 最 终 实 现 强 人 工 智能 还 有 相当 的 距离 ， 
下 一 步 可 能 需要 借鉴 人 脑 高 级 认 知 机 理 ,突破 深度 学 习 方法 ,形成 能 力 更 强大 的 知识 表示 
和 学 习 推 理 模型 。 但 业界 普遍 认为 ,最 近 5 一 10 年 ,人 工 智 能 仍 会 基于 大 数据 运行 ,并 形 
成 巨大 的 产业 红利 。 

2. 进入 智能 技术 产业 化 阶段 

在 机 器 学 习 十 大 数据 的 人 工 智 能 研究 范式 下 ,得 益 于 硬件 计算 性 能 的 快速 增强 ,智能 
算法 性 能 大 幅度 提升 ,围棋 算法 .语言 识别 .图 像 识 别 都 在 近年 陆续 达到 或 超过 人 类 水 平 ， 
智能 搜索 和 推荐 .语音 识别 .自动 翻译 、 图 像 识 别 等 技术 进入 产业 化 阶段 。 各 类 语音 控制 
类 家 电 产 品 和 脸 部 识别 应 用 在 生活 中 已 随处 可 见 ;无 人 驾驶 技术 难点 不 断 突破 ,谷歌 无 人 
驾驶 汽车 已 在 公路 上 行驶 了 300 多 万 英里 (1 英里 二 1609. 344 米 ) ,自动 驾驶 汽车 已 经 得 
到 美 、 英 政府 上 路 许可 ;德勤 会 计 师 事务 所 发 布 财务 机 器 人 ,开始 代替 人 类 阅读 合同 和 文 
件 ;IBM 的 沃 森 智 能 认 知 系统 也 已 经 在 医疗 诊断 领域 表现 出 了 惊人 的 潜力 。 

人 工 智能 的 快速 崛起 正在 得 到 资本 界 的 青睐 。Nazxre 文章 指出 , 近 一 两 年 来 ,人 工 
智能 领域 的 社会 投资 正在 快速 聚集 。2015 年 比 2013 年 增长 了 3 倍 左右 。 人 工 智 能 技术 
的 发 展 正在 由 学 术 推 动 的 实验 室 阶段 ,转向 由 学 术 界 和 产业 界 共同 推动 的 产业 化 阶段 。 

3. 进入 认 知 智能 探索 阶段 

得 益 于 深度 学 习 和 大 数据 、 并 行 计算 技术 的 发 展 ,感知 智能 领域 已 经 取得 了 重大 突 
破 , 目 前 已 处 于 产业 化 阶段 。 同 时 , 认 知 智能 研究 已 经 在 多 个 领域 启动 并 取得 重要 进展 ， 
这 将 是 人 工 智能 的 下 一 个 突破 点 。 

2016 年 年 初 ,谷歌 AlphaGo 战胜 韩国 围棋 世界 冠军 李 世 石 的 围 槛 人 机 大 战 ,成 为 人 
工 智 能 领域 的 又 一 重大 里 程 碑 性 事件 ,人 工 智能 系统 的 智能 水 平 再 次 实现 跃升 ,初步 具备 
了 直觉 ,大 局 观 、 棋 感 等 认 知 能 力 。 目 前 ,人 工 智能 的 多 个 研究 领域 都 在 向 认 知 智能 挑战 ， 
如 图 像 内 容 理 解 . 语 义理 解 、 知 识 表 达 与 推理 情感 分 析 等 ,这 些 认 知 智能 问题 的 突破 将 再 
次 引发 人 工 智 能 技术 飞跃 式 发 展 。 

除 谷 歌 外 ,微软 .Facebook、 亚 马 逊 等 跨国 科技 企业 ,以 及 国内 的 IT 巨头 都 在 投入 巨 
大 研发 力量 ,抢夺 这 一 新 的 技术 领地 。Facebook 提出 在 未 来 5 一 10 年 ,让 人 工 智 能 完成 














务 17 冯 著 论 一 、31 


某 些 需 要 “理性 思维 ”的 任务 ;* 微 软 小 冰 ” 通 过 理解 对 话 的 语 境 与 语义 ,建立 用 于 情感 计算 
的 框架 方法 ;IBM 的 认 知 计算 平台 Watson 在 智力 竞猜 电视 节目 中 击败 了 优秀 的 人 类 选 
手 ,并 进一步 应 用 于 医疗 诊断 ,法律 助理 等 领域 。 





1.5.2 未 来 40 年 的 人 工 智 能 问题 


15 位 著名 计算 机 科学 家 在 2003 年 1 月 的 ACM 杂志 上 发 表 文 章 各 自 阐述 了 未 来 计 
算 机 科学 研究 的 问题 。 下 面 综述 了 未 来 人 工 智能 领域 有 待 解决 的 问题 "3 。 

文献 [1]“ 对 计算 智能 的 一 些 挑战 和 重大 挑战 ”, 由 1994 年 图 灵 奖 得 主 Feigenbaum 
撰写 。 该 文 提出 了 未 来 计算 机 科学 发 展 的 3 个 挑战 : 第 一 ,要 开发 这 样 的 计算 机 ,它们 可 
以 通过 Feigenbaum 测试 , 即 给 定 主题 领域 中 图 灵 测 试 的 限制 版 本 ;第 二 ,要 开发 这 样 的 
计算 机 ,它们 可 以 读 文档 ,并 且 自 动 构建 大 规模 知识 库 显著 地 减少 知识 工程 的 复杂 度 ; 第 
三 ,要 开发 这 样 的 计算 机 ,它们 能 理解 Web 内 容 , 自 动 构建 相关 的 知识 库 。 

虽然 后 两 个 挑战 实质 上 都 是 一 个 大 的 知识 工程 ,但 二 者 仍然 是 有 差别 的 ,因为 第 三 个 
挑战 牵涉 一 个 开放 的 环境 。 开 放 性 通常 是 指 : 知识 表述 和 语义 理解 无 统一 标准 ; @ 知 
识 源 的 动态 性 (也 就 是 出 现 和 消失 的 随机 性 ); 四 知识 的 矛盾 性 .二 义 性 、 噪 声 , 不 完备 性 
和 非 单调 性 。 

文献 [2]“ 下 一 步 干什么 ? 12 个 信息 技术 研究 目标 ”, 由 1999 年 图 灵 奖 得 主 Gray 撰 
写 。12 个 信息 技术 研究 目标 如 下 。 

目标 1 可 伸缩 性 : 设计 可 以 扩展 10° 倍 的 软件 和 硬件 体系 结构 。 也 就 是 说 ,一 个 应 
用 程序 的 存储 和 处 理 能 力 可 以 成 百 万 倍 自动 增长 ;无 论 是 提高 工作 速度 (10* 倍速 ) 或 者 
在 相同 的 时 间 内 做 更 多 的 工作 (10* 倍 ) ,通过 且 仅 通过 增加 更 多 的 资源 即 可 。 

目标 2 图 灵 测 试 : 构建 一 个 至 少 能 赢 30% 次 的 模拟 游戏 的 计算 机 系统 。 

目标 3 言语 到 文本 : 像 本 地 人 一 样 听 音 。 

目标 4 文本 到 言语 : 像 本 地 人 一 样 说 话 。 

目标 5 像 人 一 样 看 : 识别 对 象 和 行为 。 

目标 6 个 人 麦 麦克 斯 (memex) 存 储 器 : 记录 一 个 人 看 到 的 、 听 到 的 所 有 东西 ,并 根 
据 请 求 快速 检索 任意 元 素 。 

目标 7 世界 麦 麦 克 斯 存储 器 : 构建 一 个 给 出 了 文本 全 集 的 系统 ,可 以 回答 有 关 文 本 
的 问题 ,并 像 人 类 的 该 领域 专家 一 样 尽快 `. 尽 可 能 准确 地 概述 文本 。 对 音乐 ` 图 像 ,艺术 和 
电影 业 也 能 这 样 做 。 

目标 8 远程 存在 。 在 异地 模拟 一 个 观察 者 (远程 观察 者 ) : 能 够 像 真 的 在 实地 一 样 
听 和 说 ,也 可 以 表示 一 个 与 会 者 。 在 异地 模拟 某 个 与 会 者 (远程 存在 ): 就 像 在 那里 一 样 
与 其 他 人 和 环境 交互 。 

目标 9 没有 问题 的 系统 : 构建 一 个 只 有 一 个 人 在 业余 时 间 管 理 和 维护 的 ,每 天 有 上 
百 万 人 使 用 的 系统 。 

目标 10 ”安全 系统 : 确保 目标 9 中 的 系统 只 能 被 授权 用 户 访问 ,服务 不 能 被 非 授权 
用 户 取消 ,信息 不 会 被 窃取 (并 证 明 它 ) 。 

目标 11 永远 运行 : 确保 每 100 年 系统 停止 运转 不 会 超过 1s 





有 小 数 点 后 8 个 9 
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的 可 用 性 (并 证 明 它 )。 

目标 12 自动 化 程序 设计 程序 : 设计 一 种 规范 语言 或 用 户 接口 ,满足 : @ 使 人 们 易 
于 表达 设计 ; 四 计算 机 可 编译 ; 能 够 描述 所 有 应 用 (是 完整 的 )。 这 个 系统 应 该 探究 应 
用 问题 .询问 有 关 异 常情 况 和 不 完整 规范 的 问题 ,但 是 不 能 应 用 起 来 很 烦琐 。 

文献 [3]* 计 算 机 的 理解 ,由 1992 年 图 灵 奖 得 主 Lampson 撰写 。 

计算 机 应 用 的 3 次 浪潮 分 别 是 1960 年 开始 的 模拟 ,如 核武 器 .工资 单 .游戏 .虚拟 现 
实 等 ,1985 年 开始 的 通信 (和 存储 ) ,如 电子 邮件 .航班 订 票 、 图 书 . 电 影 等 ,2010 年 开始 的 
灵 境 ,如 视觉 .语音 、 机 器 人 和 聪明 的 碎片 等 。 

本 文 重点 阐述 了 两 个 问题 : 第 1 个 问题 是 灵 境 技术 ,汽车 不 撞 人 (不 发 生 道路 交通 事 
故 ); 第 2 个 问题 是 根据 规范 自动 写 程序 。 

灵 境 技术 的 主要 挑战 是 实时 视觉 ,道路 模型 .车辆 模型 .侵入 道路 的 外 部 对 象 模型 。 
所 有 这 些 知 识 都 需要 一 个 驾驶 员 学 习 多 年 。 驾 驶 员 要 处 理 传感器 的 输入 、 车 辆 运行 中 的 
不 确定 性 因素 ,以 及 环境 中 随时 可 能 发 生 的 变化 。 满 足 可 信 性 , 即 在 面临 死亡 危险 时 , 自 
动 驾 驶 仪 必须 能 正确 工作 。 

自动 化 程序 设计 是 一 个 新 闻 题 ,人 们 为 之 奋斗 了 40 多 年 ,但 是 进展 有 限 。@ 在 某 些 
领域 ,描述 程序 设计 可 行 。Spreadsheets 和 SQL 查询 是 成 功 的 : 其 规范 与 程序 接近 。 实 
例 程 序 设 计 在 文本 编辑 器 中 和 电子 数据 表 中 是 有 用 的 。HTML 在 某 种 程度 上 也 是 成 功 
的 。 可 是 ,这 些 解决 方案 用 了 利刃 : 电子 数据 表 宏 SQL 更 新 和 对 HTML 中 的 规划 的 精 
确 控制 。 这 些 工 具 令 人 讨厌 。 四 事务 处 理 是 很 成 功 的: 它 不 借助 其 他 工作 将 一 系列 相互 
独立 的 简单 顺序 程序 转换 成 并 发 .容错 .负载 平 衡 的 程序 。@ 大 的 组 件 导致 的 差异 。 很 容 
易 将 程序 构建 在 一 个 关系 数据 库 一 个 操作 系统 和 一 个 Web 浏览 器 上 ,而 不 从 头 写 起 。 

文献 [4 六 未 来 49 年 计算 机 科学 中 的 问题 和 预测 ”。 本 文 介绍 了 研究 人 工 智 能 的 两 
个 途径 : 一 是 生物 方法 ;二 是 逻辑 方法 。 逻辑 AI 面临 的 问题 是 : 有 关 行 为 和 变化 的 事 
实 ,包括 框架 问题 在 内 的 容错 、 非 单调 推理 .三 维 世界 (近似 知识 .表象 和 真实 ) 之 间 的 
关系 。 

有 关 人 类 层次 的 智能 问题 : 人 类 层次 AI 和 我 们 如 何 到 达 那 里 ; @ 使 AI 达到 使 程 
序 能 够 读书 的 水 平 ; @ 定 义 可 以 与 任何 其 他 程序 交互 的 程序 ; @ 给 出 程序 满足 合同 的 规 
范 部 分 的 形式 化 证 明 ; @@ 让 用 户 充分 控制 他 的 计算 环境 ,也 就 是 说 ,在 用 户 对 环境 仅 有 必 
需 的 了 解 的 情况 下 ,为 他 们 设计 一 个 为 环境 重新 编程 的 方法 ; @ 用 程序 设计 语言 的 基本 
元 素 形成 语言 的 抽象 语义 ; 证 明 与 Shannon 通道 能 力 理论 的 类 似 性 。 

文献 L[5]*AI 中 3 个 未 解决 的 问题 ", 由 1994 年 图 灵 奖 得 主 Reddy 撰写 。 本 文 简 述 的 
3 个 问题 若 获 解 决 ,我 们 离 人 类 层次 的 AI 就 比较 近 了 。 

第 1 个 问题 : 从 一 本 书 中 读 一 章 并 回答 该 章 后 面 的 问题 。 为 了 让 机 器 能 够 阅读 、 理 
解 并 回答 问题 ,需要 以 下 机 制 : 将 纸 上 的 信息 转换 成 机 器 可 以 处 理 的 形式 ;在 所 有 潜在 的 
模糊 性 和 自然 语言 的 不 准确 性 条 件 下 阅读 并 理解 文章 ,解释 作者 的 意图 ;将 这 种 理解 转换 
成 可 执行 的 知识 表示 ;将 问题 解释 并 表示 成 初始 条 件 和 预期 的 目标 ;应 用 从 本 章 中 提取 出 
来 的 知识 和 以 前 已 知 的 (获得 的 ) 知 识 , 包 括 大 量 的 常识 性 知识 ,求解 当前 的 问题 。 

第 2 个 问题 : 远程 修理 。 系 统 能 够 成 功 地 在 真实 世界 环境 中 执行 任务 ,必须 理解 时 
间 和 空间 概念 以 及 近似 算法 ,此 处 程序 的 再 次 执行 并 不 一 定 总 是 给 出 相同 的 结果 。 为 了 
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在 火星 上 修理 一 个 机 器 人 ,需要 一 个 带 有 所 有 相关 工具 和 设备 的 移动 平台 ;在 一 个 半自动 
化 的 系统 中 ,人 类 管理 者 可 以 提供 指导 ,但 不 是 最 终 的 远程 操作 (注意 ,10 一 15 分 钟 的 延 
迟 取决 于 地 球 到 火星 的 相对 位 置 ,这 就 暗含 着 绝 大 部 分 的 导航 和 规避 障碍 物 必须 由 本 地 
控制 ); 可 以 用 来 修理 的 系统 意味 着 有 对 出 现 故 障 的 平台 的 拆 印 和 装配 的 准确 操作 能 力 ; 
一 个 能 够 通过 观察 人 类 操作 者 的 动作 学 习 的 系统 (需要 一 个 有 3D 视觉 ,空间 建 模 、 能 
发 现 人 类 的 动作 并 设计 出 等 价 的 操作 程序 的 系统 ); 一 个 可 以 与 人 类 对 话 并 能 验证 和 确认 
对 人 类 操作 观察 的 理解 的 系统 。 

第 3 个 问题 :“ 按 需 百 科 全 书 "”。 创 建 一 本 百科 全 书 性 的 文章 的 任务 需要 几 种 新 技 
术 , 如 将 文档 集合 起 来 定义 一 组 相关 的 文章 ;从 所 有 相关 文章 中 分 析 信 息 , 形 成 一 个 单个 
的 合并 文档 ;概述 合并 的 信息 ,形成 一 个 方便 阅读 的 规模 ;生成 最 后 概括 性 的 自然 符合 直 
党 的 语句 。 

文献 [6】 现代 人 工 智能 在 中 国 ? 中 , 金 芝 提 出 : 在 未 来 的 50 年 内 ,我 们 期 望 在 研究 诸 
如 意识 ,注意 力学 习 能 力 . 记 忆 力 .语言 .思考 力 和 推理 能 力 ,甚至 情感 等 脑 活动 的 工程 
中 ,中 国 可 以 在 智能 科学 研究 中 做 出 重要 贡献 。 一 些 特别 有 前 景 的 研究 方向 包括 : 叫 脑 
怎样 整合 与 协作 神经 细胞 复活 动 ; @ 神 经 细胞 得 如 何 接收 表示、 传送 和 重 构 可 视 化 符号 
和 意识 ; 四 如 何 使 用 经 验方 法 (例如 核磁 共振 ) 观 察 神 经 细胞 复活 动 ; 田 怎样 开发 .评价 
建 模 和 模拟 神经 细胞 簇 活动 的 数学 和 计算 方法 。 

鉴于 机 器 智能 与 人 类 智能 的 互补 性 , 吴 朝 晖 等 人 在 多 年 前 提出 了 混合 智能 CCyborg 
Intelligence, CD 的 研究 思路 ,将 智能 研究 扩展 到 生物 智能 和 机 器 智能 的 互联 互通 ,融合 
各 自 所 长 ,以 创造 出 性 能 更 高 的 智能 形态 。 混 合 智能 是 以 生物 智能 和 机 器 智能 的 深度 融 
合 为 目标 ,通过 相互 连接 通道 建立 兼 具 生 物 ( 人 类 ) 智 能 体 的 环境 感知 记忆、 推理 ,学习 能 
力 和 机 器 智能 体 的 信息 整合 ,搜索 .计算 能 力 的 新 型 智能 系统 ,如 图 1-1 所 示 中 。 
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图 1-1 混合 智能 : 新 型 智能 形态 


混合 智能 系统 是 要 构建 一 个 双向 闭环 的 , 既 包含 生物 体 , 又 包含 人 工 智能 电子 组 件 的 
有 机 系统 。 其 中 ,生物 体 组 织 可 以 接受 人 工 智能 体 的 信息 ,人 工 智能 体 可 以 读 取 生 物体 组 
织 的 信息 ,两 者 无 颖 交互。 同时 ,生物 体 组 织 实时 反馈 人 工 智 能 体 的 改变 ,反之 亦 然 。 混 
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合 智 能 系统 不 再 仅仅 是 生物 与 机 械 的 融合 体 ,而 是 同时 融合 生物 .机 械 .电子 和 信息 等 多 
领域 因素 的 有 机 整体 ,使 系统 的 行为 .感知 和 认 知 等 能 力 增强 。 

混合 智能 的 形态 表现 在 生物 智能 与 机 器 智能 在 不 同 的 层次 \ 方 式 、 功 能 、 耦 合 层次 的 
交互 融合 , 见 表 1-1。 





表 1-1 混合 智能 的 形态 




















分 类 方式 混合 智能 形态 
智能 混合 方式 增强 型 混合 智能 替代 型 混合 智能 补偿 型 混合 智能 
功能 增强 方式 感知 增强 混合 智能 认 知 增强 混合 智能 行为 增强 混合 智能 
信息 耦合 方式 穿戴 人 机 协同 混合 智能 | 脑 机 融合 混合 智能 脑 机 一 体 化 的 混合 智能 


文献 L[9] 人工 智 能 的 未 来 一 一 记忆 、 知 识 . 语 言 ” 中 , 李 航 认为 目前 人 工 智能 系统 不 具 
有 长 期 记忆 功能 。 人 脑 的 记忆 模型 由 中 央 处 理 器 .寄存 器 .短期 记忆 和 长 期 记忆 组 成 。 视 
觉 . 听 党 等 传感器 从 外 界 得 到 输入 ,存放 到 寄存 器 中 ,在 寄存 器 停留 1 一 5s。 如 果 人 的 注 
意 力 关注 这 些 内 容 , 就 会 将 它们 转移 到 短期 记忆 ,在 短期 记忆 停留 30s 左右 。 如 果 人 有 意 
将 这 些 内 容 记 住 , 就 会 将 它们 转移 到 长 期 记忆 , 半 永 久 地 留存 在 长 期 记忆 里 。 人 们 需要 这 
些 内 容 的 时 候 , 就 从 长 期 记忆 中 进行 检索 ,并 将 它们 转移 到 短期 记忆 ,进行 处 理 。 长 期 记 
忆 的 内 容 既 有 信息 ,也 有 知识 。 简 单 地 说 ,信息 表示 的 是 世界 的 事实 ,知识 表示 的 是 人 们 
对 世界 的 理解 ,两 者 之 间 并 不 一 定 有 明确 的 界线 。 人 在 长 期 记忆 里 存储 信息 和 知识 时 ,新 
的 内 容 和 已 有 的 内 容 联系 到 一 起 ,规模 不 断 增 大 ,这 就 是 长 期 记忆 的 特点 。 大 脑 中 ,负责 
向 长 期 记忆 读 写 的 是 边缘 系统 中 的 海马 体 (hippocampus)。 长 期 记忆 实际 上 存在 于 大 脑 
皮层 (cerebral cortex)。 在 大 脑 皮层 ,记忆 意味 着 改变 脑 细胞 之 间 的 链接 ,构建 新 的 链 路 ， 
形成 新 的 网 络 模式 。 

现在 的 人 工 智能 系统 是 没有 长 期 记忆 的 。 无 论 是 AlphaGo, 还 是 自动 驾驶 汽车 ,都 
是 重复 使 用 已 经 学 习 好 的 模型 或 者 已 经 被 人 工 定 义 好 的 模型 ,不 具备 不 断 获取 信息 和 知 
识 , 并 把 新 的 信息 与 知识 加 入 到 系统 中 的 机 制 。 假 设 人 工 智能 系统 也 有 意识 ,那么 其 所 感 
受到 的 世界 就 只 有 了 瞬间 到 瞬间 的 意识 。 

日 窗 美 国 物理 学 家 加 莱 道 雄 (Michio Kaku) 定义 意识 为 : 如 果 一 个 系统 与 外 部 环境 
(包括 生物 , 非 生物 、 空 间 、 时 间 ) 互 动 过 程 中 ,其 内 部 状态 随 着 环境 的 变化 而 变化 ,那么 这 
个 系统 就 拥有 “意识 ”。 按 照 这 个 定义 ,温度计 、 花 儿 是 有 意识 的 系统 ,人 工 智 能 系统 也 是 
有 意识 的 。 拥 有 意识 的 当前 的 人 工 智 能 系统 缺少 的 是 长 期 记忆 。 具 有 长 期 记忆 将 使 人 工 
智能 系统 演进 到 一 个 更 高 的 阶段 ,是 人 工 智 能 今后 发 展 的 方向 。 


1.5.3 人工 智能 鲁 棒 性 和 伦理 


在 机 器 学 习 里 ,以 往 的 研究 可 以 说 主要 是 假设 在 封闭 静态 的 环境 下 进行 的 ,因为 要 假 
定 很 多 东西 是 不 变 的 ,例如 ,数据 分 布 不 变 、 样 本 类 别 不 变 、 样 本 属性 不 变 , 甚 至 评价 目标 
不 变 等 。 但 现实 世界 是 开放 动态 的 ,一 切 都 可 能 发 生变 化 。 一 旦 某 些 重要 因素 变 了 , 原 有 
模型 马上 就 会 表现 很 差 ,而 且 没 有 理论 保证 最 差 到 什么 程度 。 所 以 ,开放 环境 下 的 机 器 学 
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习 是 一 个 很 困难 的 挑战 ,这 里 的 鲁 棒 性 很 关键 ,就 是 好 的 时 候 要 好 , 差 的 时 候 也 不 能 太 差 。 

2016 年 2 月 的 国际 人 工 智 能 大 会 上 ,AAAI( 国 际 人 工 智 能 协会 ) 前 主席 Thomas 
Dietterich 教授 做 了 一 个 纵览 人 工 智 能 全 局 、 指 引 未 来 发 展 的 报告 “ 通 往 鲁 棒 人 工 智能 
(Steps towards Robust AD”。 报 告 强调 ,人 工 智 能 技术 取得 了 巨大 发 展 , 接 下 来 就 不 可 
避免 地 会 在 一 些 高 风险 领域 应 用 ,如 自动 驾驶 汽车 .无 人 战机 、 远 程 自 动 外 科 手 术 等 ,这 些 
应 用 有 一 个 共同 的 要 求 ,就 是 不 仅 正常 情况 下 要 做 得 好 ,而 且 出 现 意 外 时 仍 不 能 有 坏 性 
能 ,否则 就 会 造成 重大 损失 。 要 解决 这 个 问题 ,他 说 人 工 智 能 技术 必须 “能 应 对 未 知情 
况 ”, 这 就 对 应 了 我 们 所 谓 的 “开放 环境 ”。 开 放 环境 下 的 机 器 学 习 研 究 是 通 往 * 角 棒 人 工 
智能 ”途径 上 的 关键 环节 之 一 。 

如 今 ,人 工 智能 伦理 成 为 国际 社会 关注 的 焦点 。 此 前 ,未 来 生命 研究 院 (FLD) 推 动 提 
出 “23 条 人 工 智 能 原则 ”,IEEE 发 起 人 工 智能 伦理 标准 项 目 并 提出 具体 指南 。 联 合 国 曾 
耗 时 两 年 完成 机 器 人 伦理 报告 ,认为 需要 机 器 人 和 人 工 智 能 伦理 的 国际 框架 。 经 济 合 作 
与 发 展 组 织 (OECD) 也 开始 考虑 制定 国际 人 工 智能 伦理 指南 。 

欧盟 在 这 方面 的 动作 也 很 频繁 ,积极 推进 人工 智能 伦理 框架 的 确立 。2017 年 ,欧盟 
议会 就 曾 通过 一 项 立法 决议 ,提出 要 制定 “机 器 人 宪章 ”, 以 及 推动 人 工 智能 和 机 器 人 民事 
立法 。2017 年 年 底 , 欧 盟 将 人 工 智能 伦理 确立 为 2018 年 立法 工作 重点 ,要 在 人 工 智 能 和 
机 器 人 领域 呼吁 高 水 平 的 数据 保护 、 数 字 权 利和 道德 标准 ,并 成 立 了 人 工 智 能 工作 小 组 ， 
就 人 工 智能 的 发 展 和 技术 引发 的 道德 问题 制定 指导 方针 。 

2018 年 3 月 9 日 ,欧洲 科学 与 新 技术 伦理 组 织 (European Group on Ethics in Science 
and New Technologies) 发 布 (关于 人 工 智能 、 机 器 人 及 “自主 ”系统 的 声明 》。 报 告 认为 ， 
人 工 智 能 、 机 器 人 技术 和 所 谓 的 “自主 ”技术 的 进步 已 经 引发 了 一 系列 复杂 的 、 吸 待 解决 的 
道德 问题 。 该 声明 呼吁 为 人 工 智能 、 机 器 人 和 “自主 ”系统 的 设计 、 和 生产、 使 用 和 治理 制定 
共同 的 、 国 际 公 认 的 道德 和 法 律 框架 。 声 明 还 提出 了 一 套 基 于 欧盟 条 约 和 欧盟 基本 权利 
宪章 规定 的 价值 观 的 基本 伦理 原则 ,为 人 工 智能 、 机 器 人 以 及 “自主 ”系统 的 发 展 提供 指导 

人 工 智能 伦理 的 关键 问题 包括 : 四 关于 安全 性 、 保 险 性 以 及 预防 损害 、 减 少 风 险 的 问 
题 ; @ 关 于 人 类 道德 责任 方面 的 问题 ; @ 人 工 智能 引发 了 关于 治理 监管. 设计、 开发 、 检 
查 、 监 督 ,测试 和 认证 的 问题 ; 四 有 关 民 主 决策 的 问题 ,主要 是 关于 制度 ,政策 以 及 价值 观 
的 决策 ,这 些 是 解决 上 述 所 有 问题 的 基础 ; @ 对 人 工 智 能 和 * 自 主 ? 系 统 的 可 解释 性 和 透 
明度 仍 存在 疑问 。 


1.5.4 新 一 代 人 工 智 能 发 展 规划 


世界 各 大 国 已 经 开始 在 国家 战略 层面 部 署 人 工 智 能 的 发 展 。2016 年 10 月 ,美国 政 
府 发 布 了 《国家 人 工 智能 研究 和 发 展 战 略 计 划 》 和 《为 人 工 智能 的 未 来 做 好 准备 ?两 份 报 
告 , 提 出 美国 优先 发 展 的 人 工 智能 七 大 战略 。2017 年 4 月 ,英国 工程 与 物理 科学 研究 理 
事 会 (EPSRC) 发布 了 《类 人 计算 战略 路 线 图 》, 明 确 了 类 人 计算 的 研究 动机 、 需 求 、 目 标 与 
范围 等 。2017 年 7 月 ,中 国政 府 印 发 (新 一 代 人 工 智能 发 展 规划 》, 将 AI 发 展 上 升 到 国家 
战略 高 度 。 各 国 已 经 展开 全 球 竞争 , 抢 抓 发 展 机 遇 ,占领 产业 制高点 。 
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中 国 (规划 ) 提 出 ,立足 国家 发 展 全 局 ,准确 把 握 全 球 人 工 智 能 发 展 态势 , 找 准 突破 口 
和 主攻 方向 ,全 面 增强 科技 创新 基础 能 力 ,全面 拓展 重点 领域 应 用 的 深度 、 广 度 ,全 面 提升 
经 济 社会 发 展 和 国防 应 用 智能 化 水 平 。 下 面 简要 介绍 中 国 《规划 ) 中 的 基础 理论 体系 、 关 
键 共性 技术 体系 和 创新 平台 。 

1. 建立 新 一 代 人 工 智能 基础 理论 体系 

(1) 大 数据 智能 理论 。 研 究 数据 驱动 与 知识 引导 相 结合 的 人 工 智能 新 方法 、 以 自然 
语言 理解 和 图 像 图 形 为 核心 的 认 知 计算 理论 和 方法 、 综 合 深度 推理 与 创意 人 工 智 能 理论 
与 方法 , 非 完全 信息 下 智能 决策 基础 理论 与 框架 数据 驱动 的 通用 人 工 智 能 数学 模型 与 理 
论 等 。 

(2) 跨 媒体 感知 计算 理论 。 研 究 超越 人 类 视觉 能 力 的 感知 获取 、 面 向 真实 世界 的 主 
动 视觉 感知 及 计算 、 自 然 声 学 场景 的 听 知 觉 感知 及 计算 、 自 然 交互 环境 的 言语 感知 及 计 
算 、 面 向 异步 序列 的 类 人 感知 及 计算 、 面 向 媒体 智能 感知 的 自主 学 习 、 城 市 全 维度 智能 感 
知 推理 引擎 。 

(3) 混合 增强 智能 理论 。 研 究 “ 人 在 回路 ?的 混合 增强 智能 .人 机 智能 共生 的 行为 增 
强 与 脑 机 协同 、 机 器 直觉 推理 与 因果 模型 .联想 记忆 模型 与 知识 演化 方法 、 复 杂 数 据 和 任 
务 的 混合 增强 智能 学 习 方 法 、 云 机 器 人 协同 计算 方法 、 真 实 世 界 环境 下 的 情境 理解 及 人 机 
群 组 协同 。 

(4) 群体 智能 理论 。 研 究 群体 智能 结构 理论 与 组 织 方法 、 群 体 智能 激励 机 制 与 涌现 
机 理 、 群 体 智能 学 习 理 论 与 方法 、 群 体 智 能 通用 计算 范式 与 模型 。 

(5) 自主 协同 控制 与 优化 决策 理论 。 研 究 面 向 自主 无 人 系统 的 协同 感知 与 交互 、 面 
向 自主 无 人 系统 的 协同 控制 与 优化 决策 、 知 识 驱 动 的 人 机 物 三 元 协同 与 互 操作 等 理论 。 

(6) 高 级 机 器 学 习 理论 。 研 究 统计 学 习 基 础 理论 .不 确定 性 推理 与 决策 分 布 式 学 习 
与 交互 ,隐私 保护 学 习 、 小 样本 学 习 、 深 度 强 化 学 习 、 无 监督 学 习 、 半 监督 学 习 , 主 动 学 习 等 
学 习 理 论 和 高 效 模型 。 

(7) 类 脑 智能 计算 理论 。 研 究 类 脑 感知 、 类 脑 学 习 、 类 脑 记忆 机 制 与 计算 融合 .类 脑 
复杂 系统 、 类 脑 控制 等 理论 与 方法 。 

(8) 量子 智能 计算 理论 。 探 索 脑 认 知 的 量子 模式 与 内 在 机 制 , 研 究 高 效 的 量子 智能 
模型 和 算法 、 高 性 能 与 高 比特 的 量子 人 工 智 能 处 理 器 、 可 与 外 界 环境 交互 信息 的 实时 量子 
人 工 智 能 系统 等 。 

2. 建立 新 一 代 人 工 智能 关键 共性 技术 体系 

新 一 代 人 工 智 能 关键 共性 技术 的 研发 部 署 以 算法 为 核心 ,以 数据 和 硬件 为 基础 ,以 提 
升 感知 识别 ,知识 计 算 、 认 知 推理 、 运 动 执行 、 人 机 交互 能 力 为 重点 ,形成 开放 兼容 \ 稳 定 成 
熟 的 技术 体系 。 具 体 包 括 如 下 8 个 方面 : 知识 计算 引擎 与 知识 服务 技术 ; @ 跨 媒体 分 
析 推 理 技术 ; @ 群 体 智能 关键 技术 ; @@ 混 合 增强 智能 新 架构 和 新 技术 ; 回 自主 无 人 系统 
的 智能 技术 ; @ 虚 拟 现实 智能 建 模 技 术 ; 智能 计算 芯片 与 系统 ; @ 自 然 语 言 处 理 技术 。 

3. 统筹 布局 人 工 智能 创新 平台 

建设 布局 人 工 智 能 创新 平台 ,强化 对 人 工 智能 研发 应 用 的 基础 支撑 ,包括 : D 人 工 智 
能 开源 软 硬 件 基础 平台 ; @ 群 体 智能 服务 平台 ; 加 混合 增强 智能 支撑 平台 ; 四 自主 无 人 
系统 支撑 平台 ; @ 人 工 智能 基础 数据 与 安全 检测 平台 。 
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什么 是 人 工 智 能 ? 试 从 学 科 和 能 力 两 方面 加 以 说 明 。 

在 人 工 智 能 的 发 展 过 程 中 ,有 哪些 思想 和 思潮 起 了 重要 作用 ? 

为 什么 能 够 用 机 器 (计算 机 ) 模 仿 人 的 智能 ? 

现在 人 工 智 能 有 哪些 学 派 ? 它们 的 认 知 观 是 什么 ? 

你 认为 应 从 哪些 层次 对 认 知 行为 进行 研究 ? 

人 工 智能 的 主要 研究 和 应 用 领域 是 什么 ? 其 中 ,哪些 是 新 的 研究 热点 ? 

未 来 人 工 智 能 的 可 能 突破 有 哪些 方面 ? 

给 出 下 列 各 命题 成 立 的 5 个 理由 。 

(1) 狗 比 昆虫 有 智能 。 

(2) 人 比 狗 有 智能 。 

(3) 一 个 组 织 比 一 个 人 有 智能 。 

根据 以 上 命题 ,给 出 “ 比 …… 更 有 智能 ”的 定义 。 

举例 说 明 计算 机 游戏 是 如 何 产生 娱乐 效果 的 ? (提示 : 从 游戏 的 可 玩 性 、 美 学 、 讲 故 

事 、 风 险 与 回报 .新奇 ,学习 、 创 造 性 、. 沉 浸 、 社 会 化 等 方面 进行 前 述 。) 

反射 行动 (如 从 热 炉子 上 缩 回 你 的 手 ) 是 理性 的 吗 ? 它们 是 智能 的 吗 ? 

内 省 一 一 梳理 自己 的 内 心 想法 一 一 怎么 可 能 是 不 精确 的 ? 我 会 搞 错 我 正 想 什么 

吗 ? 请 讨论 。 

为 什么 进化 会 倾向 于 导致 行为 合理 的 系统 ? 设计 这 样 的 系统 想 达 到 的 目标 是 

什么 ? 

(思考 题 ) 给 出 AI 应 用 的 例子 (不 是 应 用 领域 ,而 是 具体 程序 )。 针 对 每 一 个 应 用 ， 

用 至 多 一 页 篇 幅 描述 。 应 回答 如 下 问题 ; 

(1) 应 用 程序 实际 做 了 什么 事情 (如 控制 宇宙 飞船 .诊断 一 台 影 印 机 为 计算 机 用 
户 提供 智能 帮助 )? 

(2) 运用 了 哪些 AI 技术 (如 基于 模型 的 诊断 、 信 念 网 络 、. 语 义 网 .启发 式 搜索 .约束 
满足 )? 

(3) 运行 性 能 如 何 ? (依据 是 作者 陈述 ,还 是 他 人 陈述 ? 与 人 对 比如 何 ? 作者 是 如 
何 知 道 系统 的 运行 情况 的 ?) 

(4) 是 实验 系统 ,还 是 实用 系统 ? (有 多少 用 户 ? 对 这 些 用 户 的 专业 知识 有 什么 
要 求 ?) 

(5) 为 什么 系统 具有 智能 ? 什么 方面 使 系统 具有 智能 ? 

(6) [可 选编 程 语言 和 运行 环境 是 什么 ? 它 具 有 什么 样 的 用 户 界面 ? 

(7) 参考 资料 : 你 在 什么 地 方 获得 的 这 些 信息 ? 是 书籍 ,论文 ,还 是 网 页 ? 

(思考 题 ) 参考 相关 文献 ,讨论 目前 的 计算 机 是 否 可 以 解决 下 列 任 务 : 

(1) 在 国际 象棋 比赛 中 战胜 国际 特级 大 师 ; 

(2) 在 围棋 比赛 中 战胜 九段 高 手 ; 

(3) 发 现 并 证 明 新 的 数学 定理 ; 


二 














38 人 工 春 能 ( 荔 3 版 ) 


(4) 自动 找到 程序 中 的 bug。 

(5) 打 正 规 的 乒乓 球 比 赛 。 

(6) 在 埃及 开罗 市 中 心 开车 。 

(7) 在 重庆 山区 开车 。 

(8) 在 市 场 购买 可 用 一 周 的 杂货 。 

(9) 在 Web 上 购买 可 用 一 周 的 杂货 。 
(10) 参加 正规 的 桥牌 竞技 比赛 。 

(11) 写 一 则 有 内 涵 的 有 趣 故 事 。 

(12) 在 特定 的 法 律 领域 提供 合适 的 法 律 建议 。 
(13) 从 英语 到 瑞典 语 的 口语 实时 翻译 。 
(14) 完成 复杂 的 外 科 手 术 。 

1.15 〈 思 考题 ) 知 道 问 题 。 主 体 J 向 S 和 了 P 说道: 我 有 两 个 不 同 的 整数 x 和 y, 它 们 满足 
1 一 x<<y 和 x 十 y 三 100。 我 将 秘密 地 把 和 s 王 x 十 y 告 诉 S, 而 把 积 p= 二 xy 告诉 P。 
请 确定 (x 和 y) 这 两 个 数 是 什么 ? 将 和 与 积分 别 秘密 告知 S 和 PP 后 ,发 生 如 下 
对 话 : 

(1) P 说 :“ 我 不 知道 这 两 个 数 ”; 

(2) S 说 :“ 我 早已 知道 你 不 知道 这 两 个 数 ”; 
(3) P 说 :“ 我 现在 知道 这 两 个 数 了 ”; 

(4) S 说 :“ 我 现在 也 知道 这 两 个 数 了 ”。 
请 问 x 和 y 是 什么 ? 

【提示 了 答案 是 4 和 13。 

6 (思考 题 )NIM 问题 求解 。 有 3 堆 棋 子 , 两 人 轮流 取 子 , 每 人 每 次 只 能 从 一 堆 中 取 ， 
至 少 取 1 个 ,最 多 可 以 取 完 这 一 堆 , 谁 取 到 最 后 一 个 , 谁 即 取胜 。 编 一 程序 ,进行 人 
机 游戏 。 

7 〈 思 考题 ) 人 工 智 能 的 不 同 子 领域 举行 了 比赛 ,这 些 比 赛 定义 了 一 个 标准 任务 并 邀 
请 研究 者 发 挥 最 高 水 平 。 研 究 其 中 4 个 比赛 ,并 描述 过 去 5 年 取得 的 进展 。 这 些 
比赛 将 AI 的 技术 发 展 水 平 提高 到 了 什么 程度 ? 由 于 比赛 的 注意 力 不 在 新 思想 
上 ,所 以 这 对 AI 领域 有 何 种 程度 的 危害 ? 

【提示 ] 可 考虑 DARPA 的 机 器 人 汽车 陆地 挑战 赛 . 国 际 规 划 比 赛 .Robocup 机 器 人 
足球 赛 \TREC( 文 本 检索 会 议 ) 信 息 检索 比赛 、 机 器 翻译 比赛 ,语音 识别 比赛 。 

8 (思考 题 ) 人 工 智能 军事 应 用 跟踪 。 人 工 智 能 技术 在 军事 上 有 着 广阔 的 应 用 前 景 ， 

针对 一 个 或 者 多 个 领域 写 一 篇 论文 ,跟踪 并 综述 人 工 智能 的 军事 应 用 。 
【提示 】 人 工 智能 军事 应 用 举例 : 自主 多 用 途 作 战机 器 人 系统 ; @ 军 用 飞机 “ 副 
驾驶 员 ” 系 统 ; @ 自 主 多 用 途 军用 航天 器 控制 系统 ; @ 武 器 装备 的 自动 故障 诊断 
与 排除 系统 ; @ 军 用 人 工 智 能 机 器 翻译 系统 ; @ 舰 船 作战 管理 系统 ; 智能 电子 
战 系统 ; @ 自 动情 报 与 图 像 识别 系统 ; @@ 人 工 智能 武器 。 

9 (思考 题 ) 如 何 理 解 库 兹 韦 尔 ( 奇 点 临近 ) 中 的 “ 奇 点 ”? 请 探讨 人 工 智能 的 未 来 。 


1. 


PN 


li 


en 


aN 
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有 


[aN 
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要 有 效 地 解决 应 用 领域 的 问题 和 实现 软件 的 智能 化 ,就 必须 拥有 应 用 领 
域 的 知识 。 知 识 表示 技术 起 源 于 20 世纪 70 年 代 , 丰 富 的 研究 成 果 使 得 知识 
表示 技术 和 方法 多 种 多 样 。 随 着 人 工 智能 技术 的 不 断 深入 研究 和 应 用 ,关于 
知识 表示 的 工程 化 问题 取得 了 很 大 的 进展 。 

信息 获取 (感知 与 表示 )、 信 息 传 输 ( 通 信 与 存储 )、 信 息 处 理 ( 计 算 与 认 
知 )、 信 息 再 生 ( 综 合 与 决策 ) 信息 执行 (控制 与 显示 ) 是 构成 信息 科学 有 机 体 
系 的 分 支 学 科 。 知 识 成 为 由 信息 到 智能 的 中 介 。 目 前 关于 知识 的 表示 方法 
主要 分 为 结构 化 方法 和 非 结 构 化 方法 。 前 者 主要 包括 多 辑 方法 和 产生 式 方 
法 ,后 者 主要 包括 语义 网 络 和 框架 等 。 

本 章 讨 论 了 知识 表示 和 知识 表示 语言 的 问题 ,介绍 了 人 工 智 能 中 重要 的 
知识 表示 语言 一 一 命题 迎 辑 和 谓词 逮 辑 及 其 归结 推理 方法 ,产生 式 系 统 、 语 
义 网 络 、 框 架 、 脚 本 、 知 识 图 谱 等 其 他 知识 表示 和 推理 方法 ,概述 了 基于 知识 
的 应 用 系统 。 


2.1 概述 


2.1.1 知识 和 知识 表示 


数据 一 般 指 单独 的 事实 ,是 信息 的 载体 ,数据 项 本 身 没有 什么 意义 ,除非 
在 一 定 的 上 下 文中 ,否则 没有 什么 用 处 。 信 息 由 符号 组 成 (如 文字 和 数字 )， 
并 对 符号 赋予 了 一 定 的 意义 ,因此 有 一 定 的 用 途 或 价值 。 

经 验 是 人 们 在 解决 实际 问题 的 过 程 中 形成 的 成 功 操作 程序 。 知 识 是 由 
经 验 总 结 升华 出 来 的 ,因此 知识 是 经 验 的 结晶 。 知 识 也 由 符号 组 成 ,但 是 还 
包括 了 符号 之 间 的 关系 以 及 处 理 这 些 符 号 的 规则 或 过 程 。 知 识 在 信息 的 基 
础 上 增加 了 上 下 文 信息 ,提供 了 更 多 的 意义 ,因此 也 就 更 加 有 用 和 有 价值 。 
知识 是 随 着 时 间 的 变化 而 动态 变化 的 ,新 的 知识 可 以 根据 规则 和 已 有 的 知识 
推导 出 来 。 

因此 ,可 以 认为 知识 是 经 过 加 工 的 信息 , 它 包 括 事实 、 信 念 和 启发 式 规则 。 
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关于 知识 的 研究 称 为 认识 论 , 它 涉及 知识 的 本 质 、 结 构 和 起 源 。 

知识 是 建立 在 数据 和 信息 基础 之 上 的 ,那么 ,一 个 系统 需要 什么 样 的 知识 才 可 能 具有 
智能 呢 ? 一 个 智能 程序 需要 哪些 方面 的 知识 才能 高 水 平地 运行 呢 ? 一 般 来 说 ,至 少 包括 
下 面 几 个 方面 的 知识 。 

(1) 事实 : 是 关于 对 象 和 物体 的 知识 。 人 工 智 能 中 的 知识 表示 应 能 表示 各 种 对 象 、 
对 象 类 型 及 其 性 质 等 。 事实 是 静态 的 、 为 人们 共享 的 .可 公开 获得 的 、 公 认 的 知识 ,在 知识 
库 中 属 底层 知识 。 

(2) 规则 : 是 有 关 问 题 中 与 事物 的 行动 .动作 相 联 系 的 因果 关系 的 知识 ,是 动态 的 ， 
常 以 “如 果 …… 那 么 ……” 形 式 出 现 。 特 别 是 启发 式 规则 是 属 专 家 提供 的 专门 经 验 知识 ， 
这 种 知识 无 严格 解释 ,但 很 有 用 处 。 

(3) 元 知识 : 是 有 关 知 识 的 知识 ,是 知识 库 中 的 高 层 知识 。 例 如 ,包括 怎样 使 用 规 
则 、 解 释 规则 、 校 验 规 则 、 解 释 程序 结构 等 知识 。 一 个 专家 可 以 拥有 几 个 不 同 领域 的 知识 ， 
元 知识 可 以 决定 哪 一 个 知识 库 是 适用 的 。 元 知识 也 可 用 于 决定 某 一 领域 中 的 哪些 规则 最 
合适 。 

(4) 常识 性 知识 : 泛 指 普 遍 存在 而 且 被 普遍 认识 了 的 客观 事实 类 知识 , 即 指 人 们 共 
有 的 知识 。 

知识 表示 就 是 研究 用 机 器 表示 上 述 这 些 知识 的 可 行 性 有 效 性 的 一 般 方法 ,可 以 看 作 
是 将 知识 符号 化 并 输入 到 计算 机 的 过 程 和 方法 。 知 识 表 示 在 智能 Agent 的 建造 中 起 到 
了 关键 的 作用 。 可 以 说 , 正 是 以 适当 的 方法 表示 了 知识 , 才 导 致 智能 Agent 展示 出 了 智 
能 行为 。 在 某 种 意义 上 ,可 以 将 知识 表示 视 为 数据 结构 及 其 处 理 机 制 的 综合 。 

知识 表示 = 数据 结构 十 处 理 机 制 

其 中 ,恰当 的 数据 结构 用 于 存储 要 解决 的 问题 、 可 能 的 中 间 结 果 、 最 终 解答 以 及 与 问 
题 求解 有 关 的 世界 的 描述 。 这 里 称 存储 这 些 描 述 的 数据 结构 为 符号 结构 (或 者 为 知识 结 
构 ), 正 是 这 种 符号 结构 导致 了 知识 的 显 式 表 示 。 然 而 , 仅 有 符号 结构 是 不 够 的 , 它 无 法 表 
现 出 知识 的 “力量 ”。 为 此 还 需要 给 出 处 理 机 制 去 使 用 这 些 符 号 结构 。 因 此 ,知识 表示 是 
数据 结构 与 处 理 机 制 的 统一 体 , 既 考虑 知识 表示 语言 ,又 考虑 知识 使 用 。 知 识 表 示 语 言 用 
符号 结构 描述 获取 到 的 领域 知识 ,而 知识 的 使 用 则 是 应 用 这 些 知识 实现 智能 行为 。 








目前 在 知识 表示 方面 主要 有 两 种 基本 的 观点 : 一 种 是 陈述 性 的 知识 表示 观点 ;一 种 
是 过 程 性 的 知识 表示 观点 。 陈 述 性 的 知识 表示 观点 将 知识 的 表示 和 知识 的 运用 分 开 处 


理 , 在 知识 表示 时 不 涉及 如 何 运用 知识 的 问题 。 例 如 ,一 个 学 生 统 计 表 存 放 了 学 生 的 基本 
信息 ,为 了 处 理 它 ,必须 设计 另外 专门 的 程序 。 显 然 , 由 于 学 生 统 计 表 独立 存储 ,使 其 能 为 
多 个 程序 应 用 ,如 名 单打 印 ,学 生 查询 等 。 过 程 性 的 知识 表示 观点 将 知识 的 表示 和 知识 的 
运用 结合 起 来 ,知识 包含 于 程序 中 ,如 关于 一 个 倒置 矩阵 的 程序 就 隐 含 了 倒置 矩阵 的 知 
识 , 这 种 知识 与 应 用 它 的 程序 紧密 地 融合 在 一 起 ,难以 分 离 。 在 人 工 智 能 程序 中 ,采用 比 
较 多 的 是 陈述 性 知识 表示 和 处 理 方法 , 即 知识 的 表示 和 运用 是 分 离 的 。 陈 述 性 知识 在 设 
计 人 工 智 能 系统 中 处 于 突出 的 地 位 ,关于 知识 表示 的 各 种 研究 也 主要 是 针对 陈述 性 知识 
的 ,原因 在 于 人 工 智能 系统 一 般 易于 修改 、 更 新 和 改变 。 

当然 ,采用 陈述 性 知识 表示 是 要 付出 代价 的 ,计算 开销 增 大 ,并 且 效 率 会 降低 ,因为 陈 
述 性 知识 一 般 要 求 应 用 程序 对 其 做 解释 性 执行 ,显然 效率 比 用 过 程 性 知识 要 低 。 换 言 之 ， 
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陈述 性 知识 是 以 牺牲 效率 换取 灵活 性 的 。 

陈述 性 知识 表示 和 过 程 性 知识 表示 在 人 工 智 能 研究 中 都 很 重要 ,各 有 优 缺 点 。 这 两 
种 知识 表示 的 应 用 具有 如 下 倾向 性 。 

(1) 由 于 高 级 的 智能 行为 (如 和 的 思维 ) 似 乎 强烈 地 依赖 于 陈述 性 知识 ,因此 人 工 智 
能 的 研究 应 注重 陈述 性 的 开发 。 

(2) 过 程 性 知识 的 陈述 化 表示 。 基 于 知识 系统 的 控制 规则 和 推理 机 制 一 般 都 属于 陈 
述 性 知识 ,它们 从 推理 机 分 离 出 来 由 推理 机 解释 执行 ,这 样 做 可 以 促进 推理 和 控制 的 透明 
化 ,有 利于 智能 系统 的 维护 和 进化 。 

(3) 以 适当 方式 将 过 程 性 知识 和 陈述 性 知识 综合 ,可 以 提高 智能 系统 的 性 能 。 如 框 
架 系统 为 这 种 综合 提供 了 有 效 的 手段 ,每 个 框架 陈述 性 地 表示 了 对 象 的 属性 和 对 象 间 的 
关系 ,并 以 附加 程序 等 方式 表示 过 程 性 知识 。 


2.1.2 知识 -策略 -智能 


策略 就 是 关于 如 何 解决 问题 的 政策 方略 ,包括 在 什么 时 间 、 什 么 地 点 .由 什么 主体 采 
取 什 么 行动 .达到 什么 目标 ,注意 什么 事项 等 一 整套 完整 而 具体 的 行动 计划 行动 步骤 、 工 
作 方 式 和 工作 方法 。 

与 策略 相对 应 , “智能 ”应当 理 解 为 : 在 给 定 的 问题 -问题 环境 -主体 目的 的 条 件 下 , 智 
能 就 是 有 针对 性 地 获取 问题 -环境 的 信息 ,恰当 地 对 这 些 信 息 进行 处 理 , 以 提炼 知识 达到 
认 知 ,在 此 基础 上 把 已 有 的 知识 与 主体 的 目的 信息 相 结合 ,合理 地 产生 解决 问题 的 策略 信 
息 , 并 利用 得 到 的 策略 信息 在 给 定 的 环境 下 成 功 地 解决 问题 达到 主体 的 目的 。 

智能 包含 4 个 要 素 和 4 种 能 力 。4 个 要 素 包 括 信 息 、 知 识 、 策 略 和 行为 ;4 种 能 力 包括 
获取 有 用 信息 的 能 力 、 由 信息 生成 知识 ( 认 知 ) 的 能 力 、 由 知识 和 目的 生成 策略 (决策 ) 的 能 
力 、 实 施 策略 取得 效果 ( 施 效 ) 的 能 力 。 这 便 是 “智能 "概念 的 四 位 一 体 。 

在 “智能 ”的 4 个 要 素 和 4 种 能 力 之 间 ,并 不 是 完全 平等 的 关系 。 实 际 上 ,策略 是 智能 
的 集中 体现 ,因此 称 为 “狭义 智能 ”这 是 因为 获得 信息 和 提炼 知识 的 目的 都 是 为 了 生成 
策略 ,而 一 旦 生成 了 正确 的 策略 ,把 它 转变 成 为 行动 则 是 相对 明确 的 过 程 。 因 此 ,策略 处 
在 智力 能 力 的 核心 地 位 。 

图 2-1 给 出 了 广义 智能 中 “信息 -知识 -策略 ”相互 依赖 、 共 为 一 体 的 关系 。 这 个 关系 也 
可 以 表达 为 “信息 -知识 -策略 -智能 ”, 它 表现 了 由 信息 开始 向 智能 层 层 递 进 的 关系 。 
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图 2-1 智能 中 的 “信息 -知识 -策略 ”关系 
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图 2-1 给 出 了 智能 的 整体 概念 : 经 过 获取 和 传递 环节 之 后 ,相应 的 客体 信息 (包括 要 
解决 的 问题 和 问题 所 受到 的 环境 约束 ) 到 达 了 处 理 环节 ,这 里 ,客体 信息 被 加 工 提炼 成 为 
相应 的 客体 知识 ;然后 ,客体 知识 与 主体 的 目标 信息 相 结 合 , 产 生 解 决 相应 问题 的 智能 策 
略 信息 ,经 过 传递 环节 ,智能 策略 信息 被 传送 到 施 效 环节 ,后 者 把 智能 策略 信息 转变 成 为 
相应 的 智能 策略 行为 ,在 智能 策略 行为 的 干预 下 ,使 问题 得 到 解决 。 

信息 、 知 识 智能 之 间 具 有 如 下 关系 : 信息 是 基本 资源 ;知识 是 对 信息 进行 加 工 所 得 
到 的 抽象 产物 ;策略 是 由 客体 信息 和 主体 目标 演绎 出 来 的 智慧 化 身 ,智能 是 把 信息 资源 加 
工 成 知识 ,进而 把 知识 激活 成 解决 问题 的 策略 并 在 策略 信息 引导 下 具体 解决 问题 的 全 部 
能 力 。 

图 2-1 所 示 的 信息 、 知 识 、 智 能 关系 正好 符合 人 类 自身 认识 世界 和 优化 世界 活动 过 程 
中 由 信息 生成 知识 、 由 知识 激活 智能 的 过 程 。 其 中 ,获取 信息 的 功能 由 感觉 器 官 完 成 , 传 
递 信息 的 功能 由 神经 系统 完成 ,处 理 信息 和 再 生 信 息 的 功能 由 思维 器 官 完成 ,施用 信息 的 
功能 由 效应 器 官 完 

简 言 之 ,信息 经 加 工 提炼 而 成 知识 ,知识 被 目的 激活 而 成 智能 。 





2.1.3 ”人工 智能 对 知识 表示 方法 的 要 求 


很 多 大 型 而 复杂 的 基于 知识 的 应 用 系统 常常 包含 多 种 不 同 的 问题 求解 活动 ,不 同 的 
活动 往往 需要 采用 不 同方 式 表示 的 知识 ,是 以 统一 的 方式 表示 所 有 的 知识 ,还 是 以 不 同 的 
方式 表示 不 同 的 知识 ,这 是 建造 基于 知识 的 系统 时 所 面临 的 一 个 选择 。 统 一 的 知识 表示 
方法 在 知识 获取 和 知识 库 维护 上 具有 简易 性 ,但 是 处 理 效率 较 低 。 不 同 的 知识 表示 方法 
处 理 效率 较 高 ,但 是 知识 难以 获取 ,知识 库 难以 维护 。 那 么 ,在 实际 中 如 何 选择 和 建立 合 
适 的 知识 表示 方法 呢 ? 这 可 以 从 下 面 儿 个 方面 考虑 。 

(1) 表示 能 力 , 要 求 能 够 正确 有效 地 将 问题 求解 所 需要 的 各 类 知识 都 表示 出 来 。 

(2) 可 理解 性 ,所 表示 的 知识 应 易 懂 、 易 读 。 

(3) 便于 知识 的 获取 ,使 得 智能 系统 能 够 渐进 地 增加 知识 ,逐步 进化 。 同 时 ,在 吸收 
新 知识 的 同时 应 便于 消除 可 能 引起 的 新 旧 知 识 之 间 的 矛盾 ,便于 维护 知识 的 一 致 性 。 

(4) 便于 搜索 ,表示 知识 的 符号 结构 和 推理 机 制 应 支持 对 知识 库 的 高 效 搜索 ,使 得 智 
能 系统 能 够 迅速 地 感知 事物 之 间 的 关系 和 变化 ;同时 很 快 地 从 知识 库 中 找到 有 关 的 知识 。 

(5) 便于 推理 ,要 能 够 从 已 有 的 知识 中 推出 需要 的 答案 和 结论 。 


2.1.4 知识 的 分 类 


人 类 迄今 所 拥有 的 知识 已 经 构成 一 个 极其 庞大 的 学 科 体 系 , 随 着 人 类 科学 技术 活动 
的 进一步 展开 ,这 个 体系 还 会 继续 扩展 ,永远 是 一 个 开放 的 体系 。 

知识 是 认识 论 范畴 的 概念 ,是 相对 于 认识 主体 而 存在 的 。 因 此 ,与 认识 论 信息 的 概念 
相通 ,知识 具有 丰富 的 内 涵 。 同 认识 论 信息 的 情形 类 似 , 一 切 知识 ,无 论 是 数学 、 物 理学 、 
化 学 、 天 文学 、 地 学 、 生 物 学 的 知识 ,还 是 工程 科学 的 知识 ,它们 所 表达 的 “运动 状态 和 状态 
变化 的 规律 "必然 具有 一 定 的 外 部 形态 ,与 此 相应 的 知识 称 为 “形态 性 知识 ”; 同 时 ,知识 所 
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表达 的 运动 状态 和 状态 变化 的 规律 也 必然 具有 一 定 的 逻辑 内 容 , 与 此 相应 的 知识 可 以 称 


为 “内容 性 知识 ”; 最 后 ,知识 所 表达 的 运动 状态 和 状态 效用 性 知识 
变化 的 规律 必然 对 认识 主体 呈现 某 种 效用 。 与 此 相对 

应 的 知识 可 以 称 为 效用 性 知识 ”。 形 态 性 知识 .内 容 知识 人 
性 知识 ,效用 性 知识 三 者 的 综合 ,构成 了 知识 的 完整 概 形态 性 知识 
念 ,如 图 2-2 所 示 。 图 2-2 知识 的 三 位 一 体 


这 可 以 作为 一 个 公理 表述 :“ 任 何 知识 都 由 相应 的 
形态 性 知识 、 内 容 性 知识 效用 性 知识 构成 ,这 种 情形 称 为 知识 的 三 位 一 体 ”。 

容易 看 出 ,这 里 的 形态 性 知识 与 认识 论 信 息 ( 全 信息 ) 的 语法 信息 概念 相 联 系 ;内 容 性 
知识 与 认识 论 信息 (全 信息 ) 的 语义 信息 概念 相 联系 ,效用 性 知识 与 认识 论 信息 (全 信息 ) 
的 语 用 信息 概念 相 联系 。 因 此 ,知识 的 这 种 分 类 方法 抓 住 了 知识 描述 的 本 质 ,而 且 体现 了 
知识 与 认识 论 信息 (全 信息 ) 之 间 存 在 的 内 在 联系 。 这 在 理论 上 具有 重要 的 意义 。 反 之 ， 
如 果 不 能 揭示 知识 与 认识 论 信息 (全 信息 ) 之 间 深 刻 的 内 在 联系 ,那么 ,知识 理论 的 建立 就 
会 遇 到 许多 困难 。 

明确 了 知识 的 分 类 ,就 可 以 对 知识 进行 分 门 别 类 的 描述 。 


2.1.5 知识 表示 语言 问题 


对 世界 的 建 模 方式 一 般 有 两 种 : 基于 图 标的 方法 和 基于 特征 的 方法 。 基 于 图 标的 方 
法 是 用 图 形 或 类 似 图 形 的 方式 对 世界 某 些 方面 的 模拟 ;基于 特征 的 方法 是 用 文字 或 其 他 
叙述 的 方法 对 世界 某 些 特征 的 描述 。 基 于 图 标的 方法 比较 直接 ,有 的 时 候 可 能 更 有 效 一 
些 。 基 于 特征 的 方法 容易 与 别 的 系统 进行 信息 交流 和 转换 ,并 且 易 于 修改 和 分 解 成 不 同 
的 部 分 。 对 那些 难于 表达 的 信息 可 以 用 公式 表示 为 对 特征 值 的 约束 ,这 些 约束 可 以 用 来 
推断 那些 无 法 直接 感知 到 的 特征 值 。 

智能 Agent 中 对 自身 知识 和 环境 知识 的 表示 一 般 放 在 知识 库 中 ,其 中 知识 的 每 条 表 
示 称 为 一 个 语句 ,表示 这 些 语句 的 语言 称 为 知识 表示 语言 。 知 识 表示 语言 的 目标 是 用 计 
算 机 易于 处 理 的 形式 表示 知识 ,这 样 可 使 得 Agent 执行 效率 更 高 。 

知识 表示 语言 由 语法 和 语义 定义 。 语 言 的 语法 描述 了 组 成 语句 的 可 能 的 搭配 关系 。 
语义 定义 了 语句 所 指 的 世界 中 的 事实 。 

通过 语法 和 语义 ,可 以 给 出 使 用 某 一 语言 的 Agent 的 必要 的 推理 机 制 。 基 于 该 推理 
机 制 ,Agent 可 以 从 已 知 的 语句 推导 出 结论 ,或 判断 某 条 信息 是 不 是 已 蕴涵 在 现 有 的 知识 
当中 。 因 此 ,智能 Agent 所 需要 的 知识 表示 语言 是 一 种 能 够 表达 所 描述 对 象 特征 中 的 约 
束 和 特征 值 的 语言 ,以 及 可 以 进行 必要 推理 的 推理 机 制 。 一 个 语言 的 语义 确定 了 一 个 语 
句 所 指称 的 事实 。 事 实 是 世界 的 一 部 分 ,而 它们 的 表示 必须 要 编码 成 某 种 形式 ,并 物理 地 
存储 到 Agent 中 。 所 有 的 推理 机 制 都 是 基于 事实 的 表示 ,而 不 是 这 些 事实 本 身 , 即 与 具 
体 事实 无 关 , 只 与 事实 的 表示 结构 ,形式 有 关 。 

因此 ,一 个 知识 表示 语言 应 该 包括 : 语法 规则 和 语义 解释 ; 四 用 于 演绎 和 推导 的 
规则 。 

程序 设计 语言 (如 C 或 Lisp) 比 较 善于 描述 算法 和 具体 的 数据 结构 。 知 识 表示 语言 
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应 该 支持 知识 不 完全 的 情况 , 即 无 法 确定 事情 到 底 是 怎么 样 的 ,只 知道 是 或 不 是 的 某 种 可 
能 性 。 不 能 表达 这 种 不 完全 性 的 语言 是 表达 能 力 不 够 的 语言 。 

一 个 好 的 知识 表示 语言 应 该 结合 自然 语言 和 程序 设计 语言 的 优点 : 四 表达 能 力 很 
强 , 简 练 ; 四 不 含糊 ,上 下 文 无 关 ; @@ 高 效 ,可 以 推出 新 的 结论 。 

已 有 许多 知识 表示 语言 试图 满足 这 些 目 标 。 人 逻辑 ,特别 是 一 阶 逻 辑 就 是 一 种 这 样 的 
语言 , 它 是 人 工 智 能 中 大 多 数 知识 表示 模式 的 基础 。 数 理 逻 辑 是 用 数学 方法 研究 形式 逮 
辑 的 一 个 分 支 , 它 提供 了 必要 的 工具 用 来 进行 知识 表示 和 推理 。 逻 辑 是 人 们 思维 活动 规 
律 的 反映 和 抽象 ,是 到 目前 为 止 能 够 表达 人 类 思维 和 推理 的 最 精确 和 最 成 功 的 方法 。 它 
能 够 通过 计算 机 做 精确 的 处 理 , 而 它 的 表达 方式 和 人 类 自然 语言 又 非常 接近 。 因 此 ,用 数 
理 逻 辑 作 为 知识 表示 工具 自然 很 容易 为 人 们 所 接受 。 


2.1.6 现代 逻辑 学 的 基本 研究 方法 


逻辑 学 (logic) 是 研究 人 类 思维 规律 的 科学 ,而 现代 逻辑 学 则 是 用 数学 (符号 化 公理 
化 、 形 式 化 ) 的 方法 研究 这 些 规律 。 

1. 思维 : 感知 的 概念 化 和 理性 化 

思维 实体 处 于 一 个 客观 世界 , 称 为 该 实体 的 环境 ,通过 对 环境 的 感知 形成 概念 。 这 些 
概念 以 自然 语言 (包括 文字 、 图 像 声 音 等 ) 为 载体 ,在 思维 实体 中 记忆 、 交 流 , 从 而 又 成 为 
这 些 思维 实体 的 环境 的 一 部 分 。 通 过 对 概念 外 延 的 拓 广 和 对 概念 内 涵 的 修正 ,完成 思维 
的 最 基础 的 功能 一 一 概念 化 。 这 一 过 程 将 物理 对 象 抽象 为 思维 对 象 ( 语 言 化 了 的 概念 )， 
包括 对 象 本 身 的 表示 、 对 象 性 质 的 表示 、 对 象 间 关系 的 表示 等 。 

在 概念 化 的 基础 之 上 ,思维 进入 更 加 高 级 的 层次 一 一 理性 化 思维 , 即 对 概念 的 思维 : 
判断 与 推理 。 判 断 包括 : 概念 对 个 体 的 适用 性 判断 ( 特 称 判 断 、 全 称 判 断 及 其 否定 ) ,个体 
对 多 个 概念 同时 满足 或 选择 地 满足 的 判断 ( 合 取 判断 或 析 取 判断 ) ,概念 对 概念 的 蕴涵 的 
判断 (条 件 判 断 ) 等 。 推 理 可 说 是 对 概念 、 判 断 的 思维 , 即 由 已 知 的 判断 根据 一 定 的 准则 导 
出 另 一 些 判断 的 过 程 。 这 些 准则 是 思维 主体 对 自身 思维 属性 感知 并 概念 化 的 产物 。 它 们 
中 包括 “三 段 论 ”` 假 言 推理 等 。 

因此 ,思维 是 感知 的 概念 化 和 理性 化 。 现 代 逻 辑 学 的 宗旨 便 是 用 符号 化 ` 公 理化 、 形 
式 化 的 方法 研究 这 种 概念 化 、 理 性 化 过 程 的 规律 与 本 质 。 

2. 现代 逻辑 学 求助 数学 一 符号 化 

符号 化 即 用 “一 种 只 作 整 体 认 读 的 记号 (signs)” 一 一 符号 (symbols) 表 示 量 、 数 及 数 

量 关系 。 
号 化 的 初级 阶段 ,但 车 要 对 思维 作 深入 的 讨论 和 研究 ,这 种 初级 的 符号 化 是 不 够 充分 的 ， 
现代 逮 辑 除 求 助 数学 对 思维 过 程 作 符号 化 的 探讨 之 外 , 别 无 他 路 。 我 们 知道 ,数字 0,1， 
2,3,… 是 由 人 类 的 基数 、 序 数 概念 符号 化 而 来 ,但 只 是 在 有 了 “字母 表示 数 ”“ 符 号 表示 数 
的 运算 .关系 ?之 后 才 有 代数 理论 , 才 有 人 们 对 数 的 概念 的 深刻 认识 。 现 代 逻 辑 学 对 思维 
的 研究 ,需要 更 加 彻底 的 符号 化 过 程 。 我 们 也 用 字母 符号 表示 思维 的 物理 对 象 、 概 念 对 
象 、. 判 断 对 象 等 。 
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3. 现代 逻辑 学 追随 数学 公理 化 

在 欧 氏 几何 中 ,原始 概念 是 现实 世界 中 空间 形态 基础 成 分 的 概念 化 ,公理 和 逻辑 推理 
规则 是 对 空间 形态 最 基本 属性 以 及 人 类 思维 规律 概念 化 、 理 性 化 的 结果 ,因而 系统 推演 所 
得 的 定理 继承 它们 的 客观 性 和 正确 性 。 欧 氏 几 何 公 理 系统 中 的 所 有 概念 都 有 鲜明 的 直观 
背景 ,其 公理 、 定 理 也 都 有 强烈 的 客观 意义 。 像 欧 氏 几何 这 样 的 公理 系统 , 常 被 称 为 具体 
公理 系统 。 

始 于 亚 里 士 多 德 (Aristotle) 的 逻辑 学 被 符号 化 、 公 理化 ,逐步 演化 为 现代 逻辑 学 。 例 
如 ,众所周知 的 思维 法 则 “一 个 条 件 命 题 等 价 于 它 的 逆 否 命题 “全 称 判 断 蕴涵 特 称 判 断 ” 
可 以 表示 为 如 下 的 公理 模式 。 

(A—B)=(-B- -A) 
VzrA(z)— A() 

其 中 , 司 表示“ 等 价 ”, VY zxA(z) 表 示 “ 一 切 对 象 皆 满足 性 质 A”, 而 A(4) 表 示 “ 对 象 1 满足 性 
质 A”。 

事实 上 ,现代 逮 辑 学 的 公理 化 也 更 为 彻底 , 它 将 人 们 的 推理 规则 也 符号 化 和 模式 化 ， 
它们 本 质 上 和 公理 相同 ,但 为 了 突出 它们 在 形式 上 和 应 用 上 与 公理 的 区 别 , 称 为 推理 规则 
模式 。 例 如 , 假 言 推理 规则 可 以 表示 为 如 下 的 规则 模式 。 

4 一 B,A 
B 





4. 现代 逻辑 学 改造 数学 一 一 形式 化 

19 世纪 末 开 始 了 抽象 公理 系统 的 研究 。 在 抽象 公理 系统 中 ,原始 概念 的 直觉 意义 被 
忽略 ,甚至 没有 任何 预先 设 定 的 意义 。 不 加 证 明 而 接收 的 断言 一 一 公理 也 无 须 以 任何 实 
际 意义 为 背景 ,它们 无 非 是 一 些 形式 约定 一 一 一 些 符号 串 ,约定 系统 一 开始 便 要 接收 为 定 
理 的 是 哪些 语句 。 对 原始 概念 和 公理 ,人 们 甚至 可 以 不 知 所 云 ,唯一 可 识别 的 是 它们 的 表 
示 形 式 , 这 也 是 它们 唯一 有 意义 的 东西 。 

抽象 公理 系统 的 提出 往往 是 有 客观 背景 的 ,常常 是 因为 现实 世界 的 某 些 对 象 及 其 性 
质 需 精确 地 刻画 深入 地 探究 。 但 是 ,抽象 公理 系统 一 旦 建成 , 它 便 应 当 是 超脱 客观 背景 
的 , 它 可 刻画 的 对 象 已 不 限于 原来 考虑 的 那些 对 象 ,而 是 与 它们 有 着 (公理 所 规定 的 ) 共 同 
结构 的 相当 广泛 的 一 类 对 象 , 因 而 对 它们 性 质 的 讨论 也 必定 深刻 得 多 。 因 此 ,对 一 个 抽象 
公理 系统 ,一般 会 有 多 种 解释 。 例 如 ,布尔 代数 抽象 公理 系统 可 以 解释 为 有 关 命题 真 值 的 
命题 代数 ,有 关 电 路 设计 研究 的 开关 代数 也 可 以 解释 为 讨论 集合 的 集合 代数 。 

所 谓 形式 化 ,就 是 彻头彻尾 的 “符号 化 十 抽象 公理 化 "。 因 此 ,现代 逮 辑 学 在 形式 化 数 
学 的 同时 ,完成 了 自身 的 形式 化 。 综 上 所 述 ,现代 逻辑 学 形式 系统 组 成 如 下 。 

(1) 用 于 将 概念 符号 化 的 符号 语言 ,通常 为 一 形式 语言 (formal languages) ,包括 一 
符号 表 之 及 语言 的 文法 ,可 生成 表示 对 象 的 语言 成 分 项 (terms) ,表示 概念 ,判断 的 公 3 
(formulas) 。 

(2) 表示 思维 规律 的 逻辑 学 公理 模式 和 推理 规则 模式 (抽象 公理 系统 ), 及 其 依据 它 
们 推演 可 得 到 的 全 部 定理 组 成 的 理论 体系 。 

基于 现代 逻辑 学 可 构成 形式 化 的 数学 系统 或 其 他 理论 系统 ,它们 与 现代 迎 辑 学 系统 
不 同 的 只 是 : 
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(1) 表示 对 象 更 为 广泛 的 形式 语言 。 

(2) 抽象 公理 系统 中 还 包括 对 象 理 论 ( 如 数论 ) 的 公理 一 一 非 逻辑 学 公理 。 

因此 可 以 这 样 说 : 形式 化 是 现代 逻辑 学 的 基本 特性 ,形式 系统 (formal systems) 是 现 
代 逮 辑 学 的 重要 工具 ,借助 于 形式 化 过 程 和 对 形式 系统 的 研讨 完成 对 思维 规律 或 其 他 对 
象 理论 的 研究 。 

对 形式 系统 的 研究 包括 如 下 3 个 方面 。 

(1) 对 系统 内 定理 推演 的 研究 。 这 类 研究 被 看 作 是 对 形式 系统 的 语法 (syntax, 也 称 
“ 语 构 ”) 的 研究 。 

(2) 语义 (semantic) 研 究 。 公 理 系 统 、 形 式 系统 并 不 一 定 针对 某 一 特定 的 问题 范畴 ， 
但 可 以 对 它 做 出 种 种 解释 一 一 赋予 它 一 定 的 个 体 域 ,赋予 它 一 定 的 结构 , 即 用 个 体 域 中 的 
个 体 、 个 体 上 的 运算 .个 体 间 的 关系 解释 系统 中 的 抽象 符号 。 这 一 过 程 赋予 形式 系统 一 个 
语义 结构 。 在 给 定语 义 结构 中 可 以 讨论 形式 系统 中 项 对 应 的 个 体 ,公式 所 对 应 判断 具有 
的 真 值 ( 真 , 假 )。 对 语义 的 规定 及 对 形式 系统 在 给 定语 义 下 的 讨论 , 便 是 所 谓 对 形式 系统 
的 语义 的 研究 。 

(3) 语法 与 语义 关系 的 研究 。 由 于 语义 结构 通常 是 抽象 出 形式 系统 的 那个 问题 范畴 
的 数学 描述 ,因此 ,一 个 好 的 形式 系统 中 的 定理 应 当 都 是 在 所 有 相关 语义 中 的 真 命题 ; 反 
之 ,所 有 这 些 真 命题 对 应 的 形式 表示 应 当 都 是 形式 系统 的 定理 。 


2.2 命题 逻辑 


所 谓 的 命题 就 是 具有 真 假意 义 的 陈述 句 。 如 “今天 下 雨 “ 大 于 2 的 偶数 均 可 分 拆 为 
两 个 素数 的 和 ( 哥 德 巴赫 猜想 )”“1 十 100 二 101”“ 人 是 会 死 的 "等 ,这 些 句 子 在 特殊 的 情况 
下 都 具有 “ 真 (True)”" 和 “ 假 (False) ”的 意义 ,都 是 命题 。 一 个 命题 总 是 具有 一 个 值 , 称 为 
真 值 。 真 值 只 有 “ 真 " 和 “ 假 ” 两 种 ,一般 分 别 用 符号 和 下 表示 。 一切 没有 判断 内 容 的 句 
子 .无所谓 是 非 的 句子 ,如 感叹 句 、 祈 使 句 、 疑 问 句 都 不 能 作为 命题 。 如 “全 体 立 正 1”“ 明 天 
是 不 是 开会 ?”“ 天 气 多 好 啊 1”“ 我 在 说 说 ”等 ,都 不 是 命题 。 

命题 有 两 种 类 型 : 第 一 种 是 不 能 分 解 成 更 简单 的 陈述 语句 , 称 为 原子 命题 ;第 二 种 是 
由 联结 词 .标点 符号 和 原子 命题 等 复合 构成 的 命题 , 称 为 复合 命题 。 所 有 这 些 命题 都 应 具 
有 确定 的 真 值 。 

所 谓 命题 逻辑 ,就 是 研究 命题 和 命题 之 间 关 系 的 符号 逻辑 系统 ,通常 用 大 写字 母 P、 
Q、R.S 等 表示 命题 ,如 








P: 今天 下 雨 

P 就 是 表示 “今天 下 雨 ”这 个 命题 的 名 。 表 示 命 题 的 符号 称 为 命题 标识 符 ,P 就 是 命题 标 
识 符 。 如 果 一 个 命题 标识 符 表示 确定 的 命题 ,就 称 为 命题 常量 。 如 果 命 题 标识 符 只 表示 
任意 命题 的 位 置 标志 ,就 称 为 命题 变 元 。 因 为 命题 变 元 可 以 表示 任意 命题 ,所 以 它 不 能 确 
定 真 值 , 故 命题 变 元 不 是 命题 。 当 命题 变 元 P 用 一 个 特定 的 命题 取代 时 ,P 才能 确定 真 
值 ,这 时 也 称 为 对 P 进行 指派 。 当 命题 变 元 表示 原子 命题 时 ,该 变 元 称 为 原子 变 元 。 

命题 逻辑 是 非常 简单 的 一 种 多 辑 系统 。 但 是 ,命题 巡 辑 除了 有 限 的 表达 能 力 外 , 它 和 
一 阶 谓词 女 辑 一 样 包含 了 很 多 的 逻辑 概念 。 
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名 全 语法 


通常 用 大 写 拉 丁字 母 P.Q,R,S 等 表示 原子 命题 , 当 它 们 表示 确定 的 命题 时 称 为 命 
题 常 元 (propositional constants), 当 它 们 表示 不 确定 的 命题 时 称 为 命题 变 元 
(propositional variables) , 它 的 取 值 范围 是 集合 { 真 , 假 } 。 字 母 T,F 表示 真 值 分 别 为 * 真 ” 
和 “ 假 ” 的 命题 常 元 。 

命题 逻辑 的 符号 包括 以 下 几 种。 

(1) 命题 常 元 : True(T) 和 False(F); 

(2) 命题 符号 : P,Q、R 等 。 

(3) 联结 词 : 一 (否定 ,Not), -了 称 * 非 P”; @A( 合 取 ,conjunction), PAQ 表示 
“PP 和 Q”; @V ( 析 取 ,disjunction), PVQ 表 示 “*P 或 Q”; @ 习 (蕴涵 ,implication), P 一 
Q 表 示 “P 蕴涵 Q”,P 常 称 为 蕴涵 的 前 件 (antecedent),Q 常 称 为 蕴涵 的 后 件 
(consequent); @*( 等 价 ,equivalent) : PPQ 表示 “PP 当 且 仅 当 Q”。 命 题 逻辑 主要 使 用 
这 5 个 联结 词 ,通过 这 些 联结 词 ,可 以 由 简单 的 命题 构成 复杂 的 复合 命题 。 

(4) 括号 : ()。 

由 命题 常 元 、 变 元 和 联结 词 可 组 成 适当 的 表达 式 , 即 命题 公式 。 

定义 2.1 命题 公式 (propositional formula) 如 下 定义 。 

(1) 命题 常 元 和 命题 变 元 是 命题 公式 ,也 称 为 原子 公式 。 

(2) 如 果 P,Q 是 命题 公式 ,那么 (了 P)、(PAQ)、.(PVQ)、(P 一 Q)、(P”，Q) 也 是 命 
题 公式 。 

(3) 只 有 有 限 步 引 用 (1)、(2) 条 款 所 组 成 的 符号 串 是 命题 公式 。 

在 命题 逮 辑 中 ,这 5 个 联结 词 的 优先 级 顺序 (从 高 到 低 ) 为 : "、 人 、V 、 一 党。 因此 ， 
句子 了 PVQAR>S 等 价 于 句子 (( 了 P)V (QAR)) 一 S。 


2.2.2 语义 


为 了 说 明 一 个 句子 的 意义 ,必须 提供 它 的 解释 ,说 明 它 对 应 于 哪个 事实 。 如 命题 P 
可 以 表示 “今天 上 晴天”, 也 可 以 表示 ”北京 是 中 国 的 首都 "。 逮 辑 常量 True 就 表示 真 的 事 
实 ,False 则 表示 假 的 事实 。 

复合 命题 的 意义 是 命题 组 成 成 分 的 函数 。 如 复合 命题 PV Q 的 意义 就 决定 于 其 组 成 
成 分 P 和 Q 以 及 联结 词 V 的 意义 ,P 和 Q 的 意义 是 析 取 V 的 输入 ,一 旦 P.Q、V 的 意义 
确定 了 ,该 句子 的 意义 也 就 确定 了 。 

联结 词 的 语义 可 以 定义 如 下 。 

。 ”了 为 真 , 当 且 仅 当 己 为 假 。 

。， PAQ 为 真 , 当 且 仅 当 P 和 Q 都 为 真 。 

。 PVQ 为 真 , 当 且 仅 当 PP 为 真 ,或 者 Q 为 真 。 

。P 一 Q 为 真 , 当 且 仅 当 P 为 假 .或 者 Q 为 真 。 

。 PQ 为 真 , 当 且 仅 当 P 一 Q 为 真 ,并 且 Q-~P 为 真 。 
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上 述 关系 可 用 表 2-1 说 明 。 



























































表 2-1 真 值 表 

Pp 0 -Pp PAO PVO P-~O PP 一 O 

村 F T 置 时 和 

二 F F F 下 下 F 

F T F 区 F 

F F 二 F F T 

例 2.1 求 公 式 G=((PA(-Q)) 一 R) 的 真 值 表 , 其 中 “=” 可 读 为 “代表 ”。 

解 : 公式 G 共 有 2 一 8 种 指派 。 表 2-2 给 出 了 公式 G 的 8 种 指派 下 的 真 值 , 即 公 式 

G 的 真 值 表 。 它 显示 了 对 G 中 出 现 的 各 原子 赋予 的 所 有 可 能 的 真 值 与 G 的 真 值 的 对 应 
关系 
表 2-2 公式 G 的 真 值 表 

Pp Q R -0 PA-Q (CCPA(C-O)) 一 R) 

下 工 里 F F 村 

下 省 F F F 下 

里 F T T R T 

时 F F T T F 

F T 下 F F 下 

F T F F F 于 

下 F TT 下 F y 

F F F 了 F 和 

















定义 2.2 设 G 是 公式 ,Al,…,A, 为 G 中 出 现 的 所 有 原子 命题 。G 的 一 种 指派 
(assignments) 是 对 Ai ,…,A。 赋予 的 一 组 真 值 , 其 中 每 个 A; (i 二 1,…,n) 或 者 为 ,或 者 
为 F。 

定义 2.3 公式 G 称 为 在 一 种 指派 a 下 为 真 (简称 弄 真 G), 当 上 且 仅 当 G 按 该 指派 
算出 的 真 值 为 工 , 和 否则 称 为 在 该 指派 下 为 假 。 

车 在 公式 中 及 个 不 同 的 原子 A1.…,A, ,那么 该 公式 就 有 2" 个 不 同 的 指派 。 

定义 2.4 公式 A 称 为 永 真 式 或 重 言 式 (tautology) ,如 果 对 任意 指派 a,a 均 弄 真 A， 
即 a(A) 二 T。 公式 A 称 为 可 满足 的 (satisfiable) ,如 果 存 在 指派 使"(A) 王 T; 和 否则 称 A 
为 不 可 满足 的 (unsatisfiable) ,或 永 假 式 。 

很 显然 , 永 真 式 是 可 满足 的 ; 当 A 为 永 真 式 ( 永 假 式 ) 时 ,一 A 为 永 假 式 ( 永 真 式 ) 。 

定义 2.5 称 公式 A 逻辑 列 涵 公式 忆 , 记 为 A 二 >B. 如 果 所 有 和 弄 真 A 的 指派 也 必 弄 真 
公式 B; 称 公式 集 T 逻辑 蕴涵 公式 B, 记 为 T 二 >B, 如 果 和 弄 真 TT 中 所 有 公式 的 指派 也 必 弄 真 
公式 BB。 
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定义 2.6 称 公 式 A 逻辑 等 价 公 式 B, 记 为 A 兮 B, 如 果 A 二 >B 且 B 二 A。 

定理 2.1 设 A 为 含有 命题 变 元 P 的 永 真 式 ,那么 将 A 中 PP 的 所 有 出 现 均 代 换 为 命 
题 公式 B, 所 得 公式 ( 称 为 A 的 代入 实例 ) 仍 为 永 真 式 。 

定理 2.2 设 命题 公式 A 含有 子 公 式 C(C 为 A 中 的 符号 串 , 且 C 为 命题 公式 ) ,如果 
CSD, 那 么 将 A 中 子 公 式 C 的 某 些 出 现 ( 未 必 全 部 ) 用 D 替换 后 所 得 公式 也 满足 A 今 B。 

定理 2.3 好 辑 蕴涵 关系 具有 自 反 性 、 反 对 称 性 及 传递 性 , 即 逻辑 蕴涵 关系 为 一 序 关 
系 (order relations) ;多 辑 等 价 关 系 满足 自 反 性 、 对 称 性 和 传递 性 , 即 逻 辑 等 价 关 系 为 一 等 
价 关 系 (equivalent relations)。 

定义 2.7 命题 公式 B 称 为 命题 公式 A 的 合 取 (或 析 取 ) 范 式 , 如 果 B 全 A, 且 B 呈 如 
下 形式 : 

C1 CA 人 …ACa( 或 C1 V CsV*…V Cn,) 

其 中 ,C;Gi=1,2,…,m) 形 如 LiVLsV…VL,( 或 Li ALs 人 …A 人 L,),Lj(j 二 1,2,…,n) 为 
原子 公式 或 原子 公式 的 否定 , 称 工 ; 为 文字 (literals) 。 

定理 2.4 任 一 命题 公式 $ 都 有 其 对 应 的 合 取 ( 析 取 ) 范 式 。 

定义 2.8 命题 公式 B 称 为 公式 A 的 主 合 取 (或 主 析 取 ) 范 式 , 如 果 

(1) B 是 A 的 合 取 (或 析 取 ) 范 式 。 

(2) B 中 每 一 子 句 均 有 A 中 命题 变 元 的 全 部 出 现 , 且 仅 出 现 一 次 。 

定理 2.5 元 命题 公式 的 全 体 可 以 划分 为 2” 个 等 价 类 ,每 一 类 中 的 公式 彼此 逻辑 
等 价 , 并 等 价 于 它们 共同 的 主 合 取 范式 (或 主 析 取 范式 )。 


2.2.3 命题 演算 形式 系统 PC 


命题 演算 (Propositional Calculus,PC) 是 从 一 给 定 公 式 集合 产生 所 有 重 言 推论 的 形 
式 化 方法 。 

二 公 武 

符号 表 汪 =={(,)， 一, 一, 记 ,ps,p3,…}), 其 中 (,) 是 技术 符号 一 一 括号 , pi, ps， 
Pp;，… 为 命题 变 元 。 

命题 逻辑 的 合式 公式 的 定义 如 下 。 

(1) pi;,pz ,p ,… 为 命题 逻辑 的 合式 公 

(2) 如 果 A,B 是 公式 ,那么 (了 A),(A 一 B) 也 是 命题 逻辑 的 合式 公 

(3) 命题 逻辑 的 合式 公式 仅 由 (a) 、(b) 定 义 。 

2. 命题 逻辑 的 形式 系统 PC 

命题 逻辑 的 形式 系统 PC 包括 3 条 公理 模式 (A1-A3) 和 1 条 推理 规则 rm。 

Al. A>(B—>A) 

A2. (A>(B>C0))—>((A—>B)—>(A—>C)) 

A3. (mA 一 B) 一 (B-~A) 

A 

该 规则 称 为 分 离 规则 (modus ponens) 。 
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定义 2.9 称 下 列 公式 序列 为 公式 A 在 PC 中 的 一 个 证 明 (proof) 。 
= 
其 中 AiG 一 1,2,…,72) 或 者 是 PC 的 公理 ,或 者 是 A;(j 一 让 ,或 者 是 由 A;,Ai (j,k 一 门 使 
用 分 离 规则 导出 ,而 A。 即 公式 A。 
定义 2.10 称 A 为 PC 中 的 定理 , 记 为 pcA, 如 果 公式 A 在 PC 中 有 一 个 证 明 。 
定义 2.11 设 本 为 一 公式 集 , 称 以 下 公式 序列 为 公式 A 的 、 以 工 为 前 提 的 演绎 。 
.| 
其 中 Ai(i 二 1,2,…,m) 或 者 是 PC 的 公理 ,或 者 是 的 成 员 , 或 者 是 A;(j 一 让 ,或 者 是 由 
Ai,AkG ,<z 使 用 分 离 规则 导出 ,而 A。 即 公式 A。 
定义 2.12 称 A 为 前 提 F 的 演绎 结果 , 记 为 P rc A, 如 果 公 式 A 有 以 了 为 前 提 的 
演绎 。 若 二 {B}, 则 用 B rc A 表示 T rcA。 
车 B pcA,A pcB, 则 记 为 A B。 
例 2.2 证 明 pc -B 一 (B 一 A)。 


了 B 一 (BA) 的 证 明 序列 如 下 。 
(1) -B>(-A—>-B) 公理 Al 
(2) (7A—>-B)>(B—>A) 公理 A3 
(3) ((-7A—>-B)>(B—>A))—>(-B—((-7A—>-B)—>(B>A))) 公理 Al 
(4) -B—>((-A—-—B)—>(B—>A)) rm (2)(3) 
(5) (7B>((-7A>-B)>(B>A))>((-B>(-A>-B)>(-B>(B>A))) 
公理 A2 
(6) (7B>(-7A>-B)>(-B>(B>A)) rmp (4) (5) 
(7) -2B—>(B—>A) rm (1)(6) 


定理 2.6( 演 绎 定理 ) 对 PC 中 任意 公式 集 和 公式 A,B,TU{A) reB 

当 且 仅 当 TT pc A 一 B。 

定理 2.7 PC 是 可 靠 的 (sound), 即 对 任意 公式 集 T 及 公式 A, 若 TT A, 则 T A。 特 
别 地 ,车 A 为 PC 的 定理 ( A), 则 A 永 真 ( A)。 

定理 2.8( 一 致 性 定理 ) PC 是 一 致 的 (consistent) , 即 不 存在 公式 A, 使 得 A 与 -A 
均 为 PC 之 定理 。 

定理 2.9( 完 全 性 定理 ) PC 是 完全 的 (complete) , 即 对 任意 公式 集 和 公式 A, 车工 
A, 则 荆 A。 特 别 地 ,车 A 永 真 ( A), 则 A 必 为 PC 之 定理 ( A)。 


2.3 谓词 逻辑 


命题 逻辑 的 表达 能 力 很 有 限 。 一 阶 谓词 逻辑 (简称 谓词 逮 辑 ,也 称 一 阶 迎 辑 ) 根 据 对 
象 和 对 象 上 的 谓词 ( 即 对 象 的 属性 和 对 象 之 间 的 关系 ) ,通过 使 用 联结 词 和 量词 表示 世界 。 
其 主要 思想 是 : 世界 是 由 对 象 组 成 的 ,可 以 由 标识 符 和 属性 区 分 它们 。 在 这 些 对 象 中 ,还 
包含 着 相互 间 的 关系 。 

谓词 逻辑 在 数学 .哲学 和 人 工 智能 等 领域 一 直 都 非常 重要 。 选 择 谓 词 好 辑 研 究 知识 
表示 和 推理 是 因为 它 是 在 已 有 的 知识 表示 方法 中 研究 得 最 深入 、 理 解 得 最 全 面 的 方法 。 
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名 和 证 语 法 


命题 是 能 够 判断 其 真 假 的 句子 。 一 般 而 言 ,能 够 做 出 判断 的 句子 是 由 主语 和 谓语 两 
部 分 组 成 的 。 主 语 一 般 是 个 体 ,个 体 是 可 以 独立 存在 的 , 它 可 以 是 具体 的 事物 ,也 可 以 是 
抽象 的 概念 ,如 小 张 .老师 .计算 机 科学 等 。 用 于 刻画 个 体 的 性 质 ,. 状 态 和 个 体 之 间 关 系 的 
语言 成 分 就 是 谓词 。 例 如 , 张 婧 是 研究 生 , 李 婧 是 研究 生 ,这 两 个 命题 可 以 用 不 同 的 符号 
P、Q 表示 ,但 是 P 和 Q 的 谓语 有 共同 的 属性 : 是 研究 生 。 因 此 引入 一 个 符号 表示 “是 研 
究 生 ”, 再 引入 一 种 方法 表示 个 体 的 名 称 , 这 样 就 能 把 * 某 某 是 研究 生 ” 这 个 命题 的 本 质 属 
性 刻画 出 来 。 

因此 ,可 以 用 谓词 表示 命题 。 一 个 谓词 可 以 分 为 谓词 名 和 个 体 两 个 部 分 。 谓 词 的 一 
般 形式 为 

P(x 7) 
P 是 谓词 名 ,zi ,zs，…,z, 是 个 体 。 对 于 上 面 的 命题 ,可 以 用 谓词 分 别 表示 为 Graduate 
( 张 婧 )\Graduate( 李 婧 ) 。 其 中 ,Graduate 是 谓词 名 , 张 婧 和 李 婧 都 是 个 体 ,“Graduate” 刻 
面 了 “ 张 婧 "和 “ 李 婧 "是 研究 生 这 一 特征 。 

在 谓词 迎 辑 中 用 项 表示 对 象 。 常 量 符号 、 变 量 符号 和 函数 符号 用 于 构造 项 ,量词 和 谓 
词 符号 用 于 构造 句子 。 

谓词 好 辑 的 语法 元 素 表示 如 下 。 

(1) 常量 符号 : A、B、 张 婧 、 李 婧 等 ,通常 是 对 象 名 称 。 

(2) 变量 符号 : 通常 用 小 写字 母 表示 ,如 x、y、z 等 。 

(3) 函数 符号 : 通常 用 小 写 英文 字母 或 小 写 英 文字 母 串 表示 ,如 plus、f、g。 

(4) 谓词 符号 : 通常 用 大 写 英文 字母 或 ( 首 字母 ) 大 写 英 文字 母 串 表示 。 

(5) 联结 词 : ”、 人 、V .一 人。 

(6) 量词 : 全 称 量词 Y ,存在 量词 3, Vz 表示 “对 个 体 域 中 所 有 z”, 3 x 表示 “在 个 
体 域 中 存在 个 体 zx”。Y 和 习 后 面 跟 的 zz 叫 作 量词 的 指导 变 元 。 

任何 函数 符号 和 谓词 符号 都 取 指 定 个 数 的 变 元 。 若 函数 符号 /中 包含 的 个 体 数 目 
为 n, 则 称 /为 n 元 函数 符号 。 若 谓词 符号 PP 中 包含 的 个 体 数 目 为 n, 则 称 卫 为 n 元 谓 
词 符号 。 例 如 ,father(z) 是 一 元 函数 ,Less(z,y) 是 二 元 谓词 。 一 般 一 元 谓词 表达 了 个 体 
的 性 质 ,而 多 元 谓词 表达 了 个 体 之 间 的 关系 。 

在 谓词 中 ,个 体 可 以 是 常量 ,也 可 以 是 变 元 和 函数 。 例如, “zx 二 5” 可 表示 为 Less(x， 
5) ,其 中 过 是 变 元 。 又 如 ,小 王 的 父亲 是 教师 ?可 表示 为 Teacher(father(Wang)), 其 中 
father(Wang) 是 一 个 函数 。 

如 果 谓 词 P 中 的 所 有 个 体 都 是 个 体 常 量 、 变 元 或 函数 , 则 该 谓词 为 一 阶 谓词 ,如 果 某 
个 个 体 本 身 又 是 一 个 一 阶 谓词 , 则 称 P 为 二 阶 谓词 , 余 者 类 推 。 

个 体 变 元 的 取 值 范围 称 为 个 体 域 。 个 体 域 可 以 是 有 限 的 ,也 可 以 是 无 限 的 。 

谓词 和 函数 是 两 个 完全 不 同 的 概念 。 函 数 是 把 个 体 域 中 的 个 体 映 射 到 另 一 个 个 体 ， 
如 father(Wang) 将 称 为 Wang 的 这 个 人 映射 成 为 Wang 的 父亲 的 那个 人 。 所 以 ,father 
(Wang) 代 表 一 个 人 ,尽管 不 知道 他 的 名 称 。 函 数 无 真 假 可 言 。 谓 词 是 把 常量 映射 成 为 
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或 下 ,如 将 二 元 谓词 Greater(5,3) 映 射 为 ,Greater(3,5) 映 射 为 F。 

定义 2.13 项 可 递归 定义 如 下 。 

(1) 单独 一 个 个 体 是 项 (包括 常量 和 变量 ) 。 

(2) 若是 n 元 函数 符号 ,而 44,ts，… ,4 是 项 , 则 f(z,ts，… ,4,) 是 项 。 

(3) 任何 项 仅 由 规则 (1)、(2) 生 成 。 

可 见 , 项 是 把 个 体 常 量 . 个 体 变量 和 函数 统一 起 来 的 概念 。 

由 定义 可 以 看 出 plus(Cplus(z,1),z),father(father(John)) 都 是 项 ,前 者 表示 “(z 十 
1) 十 z”, 后 者 表示 "John 的 祖父 ”。 

定义 2.14 车 PP 为 n 元 谓词 符号 ,4,1ts,…,t, 都 是 项 , 则 称 PC ,ts，… ,1,) 为 原子 
公式 。 

在 原子 公式 中 , 若 4 ,ts，… ,1 都 不 含 变 量 , 则 P(4 ,ts ,…,1,) 是 命题 。 

假如 G(xz,y) 表示 谓词 x 大 于 yy ,plus(z,y) 表 示 函 数 zx 十 y, 则 

(Yz)GCplus(z,1),z)): 表示 命题 "对 任意 zx,z 十 1 都 大 于 zx”。 

(x)G(z,3): 表示 命题 “存在 xz,zx 大 于 3”。 

(Vx)(y)G(y,x): 表示 命题 “对 任 一 x 都 存在 y ,使 得 y 大 于 zx”。 

定义 2.15 一 阶 谓词 逻辑 的 合式 公式 (可 简称 为 公式 ) 可 递归 定义 如 下 。 

(1) 原子 谓词 公式 是 合式 公式 (也 称 为 原子 公式 ) 。 

(2) 若 P.Q 是 合式 公式 , 则 

(了 DP).(PAQ)、(PVQ)、.(P>Q) CP<Q) 也 是 合式 公式 。 

(3) 若 己 是 合式 公式 ,z 是 任 一 个 体 变 元 , 则 (VYxz)P、(3 z)P 也 是 合式 公式 。 

(4) 只 有 有 限 步 引用 (1)、(2)、(3) 条 款 所 组 成 的 符号 串 是 合式 公式 。 

在 谓词 逻辑 中 引入 了 量词 的 辖 域 .自由 变 元 和 约束 变 元 的 概念 。 通 常 把 位 于 量词 后 
面 的 单个 谓词 或 者 是 用 括号 括 起 来 的 合式 公式 称 为 量词 的 辖 域 , 辖 域内 与 量词 中 指导 变 
元 同名 的 变 元 称 为 约束 变 元 ,不 受 约束 的 变 元 称 为 自由 变 元 。 例 如 

(xz)CPCz,y) 一 QCry)) V RCzyy) 

其 中 CP(z,y) 一 QCz,y)) 是 (了 z) 的 辖 域 , 辖 域内 的 变 元 z 是 受 ( 了 z) 约 束 的 变 元 ,而 
R(z,y) 中 的 xz 是 自由 变 元 ,公式 中 的 所 有 y 都 是 自由 变 元 。 

在 谓词 公式 中 ,一 个 约束 变 元 所 使 用 的 名 称 符号 是 无 关 紧 要 的 ,如 (3z)PCz) 和 
( 习 y)P(y) 具 有 相同 的 意义 。 为 此 ,可 以 对 谓词 公式 中 的 约束 变 元 更 改名 称 符号 , 即 约束 变 
元 换 名 。 其 规则 如 下 : @D 约 束 变 元 可 以 换 名 ,其 更 改 的 变 元 名 称 范 围 是 量词 中 的 指导 变 元 ， 
以 及 该 量词 作用 域 中 出 现 的 该 变 元 ; @@ 所 换 的 名 必须 是 作用 域 中 没有 出 现 过 的 变 元 名 。 

对 于 谓词 公式 中 的 自由 变 元 ,也 允许 更 改 , 这 种 更 改称 为 代入 ,其 规则 如 下 : 四 对 于 
谓词 公式 中 的 自由 变 元 ,可 以 做 代入 ,代入 时 需要 在 公式 中 出 现 该 自由 变 元 的 每 一 处 进 
行 ; @@ 用 以 代入 的 变 元 与 原 公 式 中 所 有 变 元 的 名 称 不 能 相同 。 





2.3.2 语义 


一 阶 谓词 演算 形式 系统 的 语义 ,是 指 对 一 阶 语言 所 赋予 的 意义 , 即 对 个 体 常 元 、 函 词 
(也 称 函 数 ) 、 谓 词 的 指称 ,对 变 元 取 值 的 指派 ,对 量词 联结 词 意 义 的 规定 。 更 具体 地 说 ， 
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一 阶 谓词 演算 形式 系统 的 语义 是 赋予 它 的 一 个 数学 结构 ,该 结构 包括 : 

(1) 非 空 集合 口 , 称 为 个 体 域 (domains) ,确认 系统 关注 的 对 象 。 

(2) 一 个 称 为 解释 (interpretations) 的 映射 7, 它 指称 HFC) 中 的 常 元 、 函 词 .谓词 : 

对 任 一 常 元 a,I(a)EU,I(a) 常 简 记 为 a, 为 个 体 域 中 的 一 个 元 素 。 

对 每 一 函 词 /*”,I(f") 为 U 上 的 一 个 nn 元 函数 , 记 为 1 , 即 f":U">U。 

对 每 一 元 谓词 P"”,I(P") 为 U 上 的 一 个 nn 元 关系 , 记 为 Em , 即 Pm”CU"*。 当 
7 一 1 时 , Pm 为 U 的 一 个 子 集 。 当 使 用 零 元 谓词 作为 命题 常 元 时 ,IT(P*)E{T,F}, 即 I 
对 命题 常 元 指定 真 值 。 

显然 ,有 了 确定 的 结构 ,一 个 KFC) 中 的 合法 符号 串 便 有 了 一 定 的 语义 (关于 给 定 个 
体 域 的 )。 我 们 常用 德 文字 母 表示 这 样 的 一 个 结构 。 例 如 ,= 二 二 U ,1 二 表示 以 上 为 个 体 
域 ,以 I 为 解释 的 一 个 结构 。 我 们 将 全 体 结构 的 集合 记 为 T( 因 为 这 种 结构 集合 常 称 为 
Tarski 语义 结构 类 ) 。 

要 讨论 KFC) 中 公式 的 真 值 , 还 需 对 公式 中 可 能 含有 的 个 体 变 元 确定 取 值 ,并 对 量 
词 联结 词 的 意义 做 出 规定 。 

在 一 阶 谓词 演算 中 ,指派 (assignments) 是 指 映 射 5: {wm，vw，v,…)} 一 U, 即 对 任 一 
i 二 1,2,3,…,s(vi) EU, 即 s 对 变 元 指派 个 体 作 为 其 取 值 。s 可 扩展 为 下 列 从 项 集合 到 
个 体 域 的 映射 。 对 任意 项 


s(v) 当 : 为 变 元 v 时 
F(t) = 44 当 14 为 常 元 a 时 


fF) TG) EE 为 fit 
注意 ,指派 * 与 结构 中 解释 I 相对 独立 ,但 5 却 依赖 于 了 。 
我 们 把 “公式 A 在 结构 及 指派 ; 下 取 值 真 ” 记 为 AL[Lsj, 反 之 则 记 为 AL[Lsj。 而 
AL[Lsj] 表 示 在 结构 中 ,对 一 切 可 能 的 指派 A 均 为 真 ; ztA 或 A 则 表示 公式 A 在 任何 结 
构 中 恒 真 ,也 称 A 有 效 (valid) 。 
下 列 递归 定义 给 出 了 对 量词 .联结 词 的 意义 规定 , 即 给 出 了 ALsj] 的 严格 定义 。 
定义 2.16 公式 A 在 结构 .指派 * 下 真 , 即 A[s] 定 义 如 下 (以 下 省 略 中 的 符号 


(1) A 为 原子 公式 Ph…i, 时 


ALs] iff < $F) 56t2) ,s(t) >E PY 
(2) A 为 公式 -了 B 时 
A[s] iff B[s] 
(3) A 为 公式 BC 时 
A[s]iff BLs] 或 C[s] 
(4) A 为 公式 VYvB 时 
A[s] iff ”对 每 一 4 EU, 有 B[sCo | d)] 
其 中 ,s(vlq) 表 示 一 个 与 s 稍 有 不 同 的 指派 , 它 对 变 元 v 指定 元 素 d ,而 对 其 他 变 元 的 指 
派 与 s 相同 , 即 对 任何 变 元 x 
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so = 
d 当 和 二 各 


当 使 用 联结 词 V、A 和 量词 3 ,或 将 它们 看 作 定 义 的 符号 时 ,可 补充 如 下 规定 。 
BYVCLsjiff B[s] 或 C[s] 
BACLsjiff B[s] 且 C[s] 
3zB[s] iff 存在 d €E U, 使 得 BLs(v | d)] 
容易 证 明 : 
3zB[] iff ”YonB[s] 
定义 2.17 对 于 谓词 公式 A ,如果 至 少 存在 结构 和 指派 ;, 使 公式 A 在 此 结构 和 指 
派 下 的 真 值 为 T, 则 称 公式 A 是 可 满足 的 。 
例 2.3 考虑 以 下 结构 , 它 被 赋予 只 含 一 个 函 词 一 个 谓词 和 一 个 常 元 的 一 阶 谓词 演 
算 系统 。 
DU 二 {0,1,2,3,…}, 即 自然 数 集 NN。 
Pi 为 N 上 的 过 关系 。 
了 4? 为 N 上 的 后 继 函 数 J? (zr) 二 =z 十 1。 
ai=0。 
这 时 有 Pfaff?w ,因为 不 管 取 何 种 指派 s,0 三 J 人 sv) 二 sv) 十 1 始终 成 立 ,但 
Pi fi? wal 则 对 任何 指派 * 均 不 能 成 立 。 此 外 ,我 们 有 Vw Pi?”aivi ,因为 对 任何 指派 s 
及 任何 &WEU，Pi2aiu[sCu ld)] 均 能 成 立 。 
谓词 公式 的 等 价 性 和 永 真 强 涵 可 分 别 用 相应 的 等 价 式 和 永 真丝 涵 式 表示 ,这 些 等 价 
式 和 水 真 蕴 涵 式 都 是 演绎 推理 的 主要 依据 ,因此 也 称 为 推理 规则 。 
定义 2.18 设 忆 与 Q 是 D 上 的 两 个 谓词 公式 , 若 对 了 上 的 任意 指派 ,已 与 Q 都 有 
相同 的 真 值 , 则 称 P 和 Q 在 D 上 是 等 价 的 。 如 果 D 是 任意 非 空 个 体 域 , 则 称 P 卫 与 Q 是 
等 价 的 , 记 作 PSSQ。 





常用 的 等 价 式 如 下 。 

(1) 双重 否定 律 ”PP 

(2) 交换 律 PVQSQVP,PAQSQAP 

(3) 结合 律 (PVQ VRSEPV (QVR),(PAQ ARSPA (QAR) 

(4) 分 配 律 PV (QARS(PVO A(PVR),PA(QVRSO(PAOWV (PAR) 
(5) 德 。 摩根 律 -7(PVQOS-PA -7Q,-7(PAOWSO-PV -7Q 

(6) 吸收 律 PV (PAQMSP,PA (PVQOSP 

(7) 补 余 律 PV -PET,PA -PEOF 


(8) 联结 词 化 归 律 PQ 人 S- 了 PVQ,PoQS(P>Q) (QP)， 
PQS(PAQV ("PA-Q) 

(9) 量词 转化 律 (I3z)PO(Vz)(TP), "(VX)PO(Iz)(TP) 

(10) 量词 分 配 律 ” (Vz)(PAQ) 全 CVz)PACVz)Q 
(3z)(PVQ) 拓 (3z)PV(3z)Q 

定义 2.19 对 谓词 公式 P 和 Q ,如果 P-~Q 永 真 , 则 称 已 永 真 蕴涵 Q, 且 称 Q 为 也 
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的 逻辑 推论 ,P 为 Q 的 前 提 , 记 作 P=Q。 


常用 的 永 真 蕴涵 式 如 下 。 
(1) 化 简 式 
P AQ=>P PAQ=Q 
(2) 附加 式 
P=>PVQ QPVQ 
(3) 析 取 三 段 论 
-P,PV Q=>Q 
(4) 假 言 推理 
P,P— Q>Q 
(5) 拒 取 式 
QP==Q>"P 
(6) 假 言 三 段 论 
P—>Q,Q—> R=>P—R 
(7) 二 难 推理 


PV Q,P—R,Q— R=>R 
(8) 全 称 特 化 
(VXI)P(r)=>P(y) 
其 中 y 是 个 体 域 中 的 任 一 个 体 。 利 用 此 永 真 蕴 涵 式 可 以 消去 公式 中 的 全 称 量词 。 
(9) 存在 特 化 
(3xz)P(r)=>P(y) 
其 中 y 是 个 体 域 中 某 一 个 可 使 P(y) 为 真 的 个 体 。 


2.3.3 ”谓词 逻辑 形式 系统 FC 


一 阶 谓词 演算 (the first-order predicate calculus, 简 记 为 FC) 系统 的 理论 部 分 也 称 为 
一 阶 逻辑 (first-order logic) ,它们 可 用 .多 表示。 系统 FC 的 理论 部 分 记 为 4(FC), 它 的 组 
成 如 下 。 

(FC) 的 公理 组 由 下 列 公理 模式 及 其 所 有 全 称 化 组 成 。 这 里 ,A、B、C 为 FC 的 任意 
公式 ,v 为 任意 变 元 ,i 为 任意 项 。 

AX(1.1). A 一 (B 一 A) 

AX(1.2). (4 一 (B 一 C)) 一 ((A 一 B) 一 (A 一 C)) 

AX(1.3). ("A—-B)—>(B—>A) 

AX2. VvA 一 A,"(t 对 A 中 变 元 v 可 代入 ) 

AX3.Vuv(A-~B) 一 (VvA 一 VuB) 


AX4. A 一 VvA(v 在 A 中 无 自由 出 现 ) 
LFC) 的 推理 规则 模式 仍 为 rw 全" 人 8 


在 一 阶 谓词 演算 系统 中 ,“ 证 明 ”“ 为 4 中 的 定理 “公式 A 的 、 以 为 前 提 的 演绎 ”,“A 
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为 前 提 T 的 演绎 结果 ”等 概念 与 命题 逻辑 系统 类 似 。 

定理 2.10 对 FC 中 的 任 一 公式 A, 变 元 v, 如 果 A, 那 么 VwvA( 全 称 推广 规则 )。 

定理 2.11 设 T 为 FC 的 任 一 公式 集合 ,A、B 为 FC 的 任意 公式 ,那么 

T;A B 当 且 仅 当 TT A 一 B 

定理 2.12 一 阶 谓词 演算 系统 是 可 靠 的 , 即 a 蕴涵 着 a。 

定理 2.13 一 阶 谓词 演算 系统 是 完全 的 , 即 a 蕴涵 着 a。 

定义 2.20 一 类 问题 称 为 是 可 判定 的 ,如 果 存 在 一 个 算法 或 过 程 ,该 算法 用 于 求解 
该 类 问题 时 ,可 在 有 限 步 内 停止 ,并 给 出 正确 的 解答 。 如 果 不 存在 这 样 的 算法 或 过 程 , 则 
称 这 类 问题 是 不 可 判定 的 。 

定理 2.14 任何 至 少 含有 一 个 二 元 谓词 的 一 阶 谓词 演算 系统 都 是 不 可 判定 的 。 

定理 2.15 一 阶 谓词 演算 是 半 可 判定 的 , 即 对 于 一 阶 谓词 演算 ,存在 一 个 可 机 械 地 
实现 的 过 程 ,能 对 一 阶 谓词 演算 中 的 定理 做 出 表 定 的 判断 ,但 对 于 非 定理 的 一 阶 谓词 演算 
公式 , 却 未 必 能 做 出 否定 的 判断 。 

定义 2.21 文字 是 原子 或 原子 之 非 。 

定义 2.22 公式 G 称 为 合 取 范式 , 当 且 仅 当 G 有 形式 G; 人 G, 入 … 人 G,(n 宇 1), 其 中 
每 个 G; 都 是 文字 的 析 取 式 。 公 式 G 称 为 析 取 范式 , 当 且 仅 当 G 有 形式 G1 V Gs V…VG， 
(n 宇 1) ,其 中 每 个 G; 都 是 文字 的 合 取 式 。 

定理 2.16 对 任意 不 含量 词 的 公式 ,都 有 与 之 等 值 的 合 取 范式 和 析 取 范式 。 

可 按 下 述 程序 使 用 2. 3. 2 节 中 的 等 价 式 将 一 个 公式 化 为 合 取 范式 或 析 取 范式 。 

(1) 使 用 等 价 式 中 的 联结 词 化 归 律 消去 公式 中 的 联结 词 一 ,一 。 

(2) 反复 使 用 双重 否定 律 和 德 。 摩根 律 将 一 移 到 原子 公式 之 前 。 

(3) 反复 使 用 分 配 律 和 其 他 定律 得 出 一 个 标准 型 。 

在 一 阶 逻辑 中 ,为 了 简化 定理 证 明 ,程序 需要 引入 所 谓 的 “前 束 标准 型 ”。 

定义 2.23 设 下 为 一 谓词 公式 ,如 果 其 中 的 所 有 量词 均 不 以 否定 形式 出 现在 公式 之 
中 ,而 它们 的 辖 域 为 整个 公式 , 则 称 下 为 前 东 范 式 。 一 般 地 ,前 东 范 式 可 以 写成 

(Qiz) (QT Mr 7,) 

其 中 ,Q;(i 二 1,2,…,n) 为 前 级 , (Qi )…(Q,z,) 是 一 个 由 全 称 量词 或 存在 量词 组 成 的 量 
词 串 ,M(zi,… ,zx,) 为 母 式 , 它 是 一 个 不 含 任何 量词 的 谓词 公式 。 

为 了 把 一 个 公式 化 为 前 束 范式 ,需要 对 2. 3. 2 节 的 等 价 式 扩充 ,使 之 包含 一 阶 好 辑 特 
有 的 等 价 式 对 ,如 下 所 示 。 

(1) (Qz)FGz)VGe(Qzr)CFCz)VG) 

(2) (QF(z) MGSO(QT) F(z) AG) 

(3) (QF V (QI HC)OQ TQ F(T V H(z)) 

(4) (QF A (QIHOOQ TQ F(z) A H(z)) 

在 上 述 等 价 公 式 对 中 ,F(z) 和 玉 (z) 都 表示 含 未 量化 变量 工 的 公式 ,G 表示 不 含 未 量 
化 变量 z 的 公式 ,Qi 、Q; 或 为 3 ,或 为 VY 。 对 (3) 和 (4) ,要求 不 出 现在 F(x) 中 ,并 且 符 
合约 东 变 量 的 换 名 原则 。 

使 用 前 面 定义 的 等 价 式 .总 可 以 把 一 个 公式 化 为 前 东 标 准 型 。 变 换 过 程 如 下 。 

(1) 使 用 等 价 式 中 的 联结 词 化 归 律 消去 公式 中 的 联结 词 一、 。 
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(2) 反复 使 用 双重 否定 律 和 德 * 摩根 律 将 “一 ” 移 到 原子 公式 之 前 。 

(3) 必要 时 重新 命名 量化 的 变量 。 

(4) 使 用 量词 分 配 律 和 等 价 式 把 所 有 量词 都 移 到 整个 公式 的 最 左边 ,最 终 得 出 一 个 
范式 。 


2.3.4 一 阶 谓词 逻辑 的 应 用 


本 节 给 出 两 个 例子 说 明 一 阶 逻 辑 在 问题 求解 中 的 应 用 。 处 理 问 题 的 一 般 途 径 是 首先 
对 问题 进行 符号 化 ,之 后 证 明 某 个 公式 是 男 一 组 公式 的 逻辑 推论 。 
例 2.4 “ 某 些 患者 喜欢 所 有 医生 。 没 有 患者 喜欢 庸 医 。 所 以 没有 医生 是 庸 医 。” 
解 : 定义 谓词 如 下 。 
P(z) 表 示 “z 是 患者 ",D(z) 表 示 “z 是 医生 ”,Q(Cz) 表 示 “z 是 良 医 ”,L(x,y) 表 示 “zx 
喜欢 y”。 前 提 和 结论 可 以 符号 化 如 下 。 
Fi: (Jz)(P(zx) A (Vy)(D(y) 一 LOzy))) 
F;2: (Vz)(P(zx)—> (Vy)(Q(y) 一 ”LIGzyy))) 
G: (VT (D(zr) —> Q(X)) 
目的 是 证 明 G 是 FF 和 已 的 逻辑 结论 。 
令 了 为 定义 域 六 上 的 任 一 解释 。 设 了 满足 下 和 F,, 因 为 了 满足 下, 那么 存在 DD 中 
的 元 素 e ,使 工 满 足 : 
(P(e) 人 A(CVy)CDCy) > L(e,y))) 
即 工 满足 PCe) 和 (VCD(Cy) 一 LCe,y))。 另 一 方面 ,对 了 中 的 所 有 元 素 工 , 工 都 满足 
P(z) 一 (Vy)(Q(Cy) 一 "L(xz,y)) 
那么 工 满足 : 
Ple) > (Vy)(Q(y) 一 Lesy)) 
因为 工 满足 P(e) ,所 以 工 必 满 足 : 
(VY)(Q(y) 一 Le,y)) 
那么 ,对 D 中 的 每 个 元 素 y, 工 都 满足 : 
(Q(y) 一 ”Ley)) 和 (DCy) > L(e,y)) 
如 果 工 使 得 D(y) 为 假 , 则 工 满足 (DCy) 一 ”Q(Cy))。 如 果 工 满足 D(y), 则 工 满足 工 (e， 
y)。 但 是 ,I 满足 (Q(y) 一 一 L(e,y)), 所 以 了 必 使 得 Q(y) 为 假 , 即 I 满足 (D(y) 一 -了 Q 
(y))。 所 以 ,对 DD 中 的 每 个 元 素 y ,I 都 满足 (D(Cy) 一 Q(y)), 即 满足: 
(Vz)CDCz) > 7 Q(z)) 
这 就 证 明了 G 是 F, 和 F 的 逻辑 结论 。 
例 2.5 使 用 推论 规则 证 明 下 列 推断 : 每 个 去 临潼 游览 的 人 或 者 参观 秦始皇 兵马俑 ， 
或 者 参观 华清池 ,或 者 洗 温泉 澡 。 凡 去 临潼 游览 的 人 ,如 果 疏 骊 山 ,就 不 能 参观 秦始皇 兵 
马 俑 ,有 的 游览 者 既 不 参观 华清池 ,也 不 洗 温泉 澡 。 因 而 有 的 游览 者 不 仆 骊 山 。 
解 : 定义 G(z) 表 示 “z 去 临潼 游览 ”; 
A(z) 表 示 “z 参观 秦始皇 兵马俑 ”; 
B(x) 表 示 “z 参观 华清池 ”; 


57 





58 人 工 乔 能 ( 荔 3 瞩 ) 


C(z) 表 示 “z 洗 温 泉 澡 ”; 
D(x) 表示“z 爬 骊 山 ”。 


前 提 : Vz(GCz) 一 A(z)VBCz)VCCz)) (1) 
Vzr(G(r) AD(z)—> -A(z)) (2) 
I3z(G(zr) A -Br) A -C7)) (3) 

结论 : 3 (G(x)A -D(z)) 

证 明 : (4) Gla)A -Bl(a)A -mC(a) 由 (3) 

(5) G(a) >A(a)V B(a)VC(a) 由 (1) 

(6) Gl(a) AD(a)—> -Al(a) 由 (2) 

(7) A(a)—> -Gla)V -D(a) 由 (6) 

(8) Gla) 由 (4) 

(9) A(a) V Bla)V Cla) 由 (5)、(8) 

(10) -7B(a), ~ C(a) 由 (4) 

(11) A(a) 由 (9) (10) 
(12) -D(a) 由 (7)、(8) (11) 
(13) 3xz(G(z) A -D(z)) 由 (8) (12) 


2.4 归结 推理 


1930 年 , Herbrand 为 定理 证 明 建立 了 一 种 重要 方法 ,奠定 了 机 械 定 理 证 明 的 基础 。 
机 械 定理 证 明 的 主要 突破 是 1965 年 由 J. A. Robinson 做 出 的 ,他 建立 了 归结 原理 ,使 机 
械 定理 证 明达 到 了 应 用 阶段 。 本 节 引 入 归结 推理 规则 ,并 在 此 基础 上 讨论 归结 反 演 求 解 


2.4.1 命题 演算 中 的 归结 推理 


1. 子 句 与 子 句 集 

一 个 子 句 (clause) 是 一 组 文字 的 析 取 。 一 个 文字 或 是 一 个 原子 (正文 字 ) ,或 是 一 个 
原子 的 否定 ( 负 文 字 ) ,如 P、Q、- 了 R 都 是 文字 ,PV QV 了 R 是 子 句 。 

命题 演算 中 的 任何 合式 公式 都 可 以 被 转换 为 一 个 等 价 的 子 句 的 合 取 式 , 即 对 任意 公 
式 G, 都 有 形 如 Gi 人 Gs 人 … 人 AG,(n 宇 1) 的 公式 与 之 等 价 ,其 中 每 个 G; 都 是 文字 的 析 取 
式 , 即 一 个 子 句 。 可 以 使 用 各 种 等 价 式 将 任意 一 个 公式 G 转化 为 一 个 合 取 范式 。 

一 个 子 句 的 合 取 范式 (CNF 形式 ) 常 常 表示 为 一 个 子 句 的 集合 ,如 S={(PV -RR)， 
(TQV -RVP)}。S 称 为 对 应 公式 (PV 了-R) 和 人 ("QV -RVP) 的 子 句 集 ,其 中 每 个 元 
素 都 是 一 个 子 句 。 把 公式 表示 为 子 句 集 只 是 为 了 说 明 上 的 方便 。 

例 2.6 将 公式 ”(P->Q)V CR-~P) 化 为 子 句 集 。 

解 : (1) 用 等 价 的 形式 消除 蕴涵 符号 ,得 -(- 了 PVQ)V (7RVP) 

(2) 用 德 . 摩根 定律 和 用 消除 双 ” 符 号 的 方法 缩小 ”符号 的 辖 域 ; 

(PAnmQVCnRYVP) 
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(3) 用 结合 律 和 分 配 律 把 它 转 换 为 合 取 范 式 : 

(PV -RVP)A("QV -RVP) 

(4) 消去 重复 的 P: (PV -R)A(-QV-RVP) 

(5) 化 为 子 句 的 集合 {(PV 了-R),(-QV -RVP)} 

2. 子 句 上 的 归结 

命题 逻辑 的 归结 规则 可 以 陈述 如 下 。 

设 有 两 个 子 句 : C=PV C' ,Cs 一 PVC' (其 中 CC' 是 子 句 ,P 是 文字 ) ,从 中 
消去 互补 对 ( 即 P 和 一 P) ,所 得 的 新 子 句 R(C ,Cs) 二 C1V C's 便 称 作 子 句 Ci ,Cs 的 归结 
式 , 原 子 PP 称 为 被 归结 的 原子 。 这 个 过 程 称 为 归结 。 没 有 互补 对 的 两 子 句 没有 归结 式 。 

因此 ,归结 推理 规则 指 的 是 对 两 子 句 做 归结 , 即 求 归结 式 。 

例 2.7 计算 下 述 子 句 的 归结 式 : 

(1) Gi: PVR,C:: -PVQ 

由 C 和 Cs 中 分 别 删除 P 和 一 P, 得 出 归结 式 为 RVQ。 

这 两 个 被 归结 的 子 句 可 以 写成 : -R 一 P,P 一 Q。 可 以 看 出 ,三 段 论 是 归结 的 一 个 
特例 。 

Cats PO GP 

C 和 C: 的 归结 式 为 Q。 因 为 C 可 以 写作 PQ, 所 以 可 以 知道 假 言 推理 也 是 归结 
的 一 个 特例 。 

(3) CC: TPVQVR,C:: "QV TIR 

Cl 和 C: 存在 两 个 归结 式 ,一 个 是 : "PVRYV 了-R, 另 一 个 是 : -PVQV ”Q。 

(C4) .Cis QC 5 

Q@ 和 一 Q@ 是 互补 的 ,归结 式 是 空子 句 , 用 口 表示 。 空 子 句 的 出 现代 表 出 现 了 矛盾 。 

3. 归结 的 合理 性 

定理 2.17 子 句 Cl 和 Cs 的 归结 式 是 Cl 和 Ci 的 逻辑 推论 。 

证 明 : 设 














G=PVCnG="PYC 
有 
R(Gi,C:) 一 CU VC， 

其 中 C', 和 C', 都 是 文字 的 析 取 式 。 

假定 C 和 C; 根据 某 种 解释 工 为 真 。 若 己 按 工 解释 为 假 , 则 C, 必 不 是 单元 子 句 ( 即 
单个 文字 ) ,否则 Ci 按 工 解释 为 假 。 因 此 ,C" 按 工 必 为 真 , 即 归结 式 RCC,C:) 王 Ca V 
C', 按 了 为 真 。 

车 PP 按 了 I 为 真 , 则 了-P 按 I 为 假 , 此 时 Cs 必 不 是 单元 子 句 ,并 且 C', 必 按 工 为 真 , 所 
以 RC(C1,Cs) 二 C1V C's 按 了 为 真 。 由 此 得 出 ,RCCi ,Cs) 是 C 和 C, 的 逻辑 推论 。 证 毕 。 

4. 归结 反 演 

车 子 句 集 S 是 不 可 满足 的 , 则 可 以 使 用 归结 规则 由 S 产生 空子 句 

例 2.8 考虑 子 句 集合 S: 














CGC: "PVQ 
C:: ”Q S 
Cs P 
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由 Ci 和 Cs 可 以 得 出 归结 子 句 : 
Cs BE 
由 Cs 和 C 可 以 得 出 归结 子 句 : 











Gus 
至 此 得 出 了 由 S 对 口 的 演绎 : C ,…',Cs 字 口 。 现 在 可 以 断定 S 是 不 可 满足 的 ,否则 若 S 
是 可 满足 的 , 则 存在 解释 了 满足 Ci ,Cs 和 C; ,由 定理 2.17 可 知 ,[ 也 满足 C, ,这 是 不 可 能 
的 ,因为 1 不 可 能 同时 满足 C3 和 CCC: 和 C, 的 归结 式 是 口 ) 。 

归结 是 一 种 极 有 力 的 推理 规则 ,是 一 种 合理 的 推理 规则 。 也 就 是 说 ,KB w 蕴涵 
KB w., 

为 了 从 一 个 合式 公式 集合 KB 中 证 出 某 一 公式 ww, 可 以 采用 下 述 的 归结 反 演 过 程 。 

(1) 把 KB 中 的 合式 公式 转换 成 子 名 形式 ,得 到 子 句 集合 So。 

(2) 把 待 验证 的 结论 zw 的 否定 转换 为 子 句 形式 ,并 加 入 到 子 句 集合 S。 中 得 到 新 的 子 
句 集合 S。 

(3) 反复 对 S 中 的 子 句 应 用 归结 规则 ,并且 把 归结 式 也 加 入 到 S 中 ,直到 再 没有 子 句 
可 以 进行 归结 ,如 果 产 生 空子 句 , 则 说 明 可 以 从 KB 推出 zw ,否则 说 明 KB 无 法 推出 w 

例 2.9 用 归结 方法 证 明 PA (PQ) A (QR) 二 R 

证 明 : 先 将 PA(P 一 Q) (QR) 化 成 子 句 形式 ,得 到 子 句 集合 So: 

S = {P,-PV Q,-"QV R} 
再 把 尺 的 否定 化 为 子 句 形式 ,并 加 入 到 S。 中 得 到 子 句 集 合 S: 
S= {P,PV Q,"QV R,-R} 









































对 S 作 归 结 : 

(1) P 

(2) -PVQ 

(3) -QVR 

(4) -7R 

(5) 0 (1) (2) 归 结 

(HR (3)、(5) 归 结 

(7) (4)、(6) 归 结 

证 毕 。 

5. 命题 逻辑 归结 反 演 的 合理 性 和 完备 性 

合理 性 是 指证 明 过 程 的 正确 性 ,完备 性 说 明 使 用 该 方法 可 以 得 到 所 有 可 能 的 推断 。 

定理 2.18 归结 反 演 是 合理 的 。 

证 明 : 给 定子 句 集 S 和 目标 w。 假 设 使 用 归结 反 演 可 以 由 S 推导 出 ww, 即 S w。 现 
在 需要 证 明 的 是 该 推导 在 逻辑 上 是 合理 的 , 即 S ww。 

现 假 定 S w 不 成 立 , 即 假设 有 一 种 满足 S 的 赋值 ,满足 ”ze( 即 S 一 w)。 对 这 样 一 
种 赋值 ,S 中 任意 两 个 子 句 的 归结 式 为 真 ,这 样 ,即便 穷尽 所 有 可 以 归结 的 子 句 所 得 到 的 
归结 式 也 不 会 为 假 , 这 与 S mg 矛盾。 所 以 ,假定 S 一 w 是 错误 的 ,这 样 S w 就 是 正 
确 的 。 

定理 2.19 归结 反 演 是 完备 的 (refutation complete) , 即 从 S a 可 推出 S a, 其 中 a 
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为 一 公式 ,S 为 子 句 集 。 

6. 归结 反 演 的 搜索 策略 

对 子 句 集 进行 归结 时 ,一 个 关键 问题 是 决定 选取 哪 两 个 子 句 作 归结 ,为 此 需要 研究 有 
效 的 归结 控制 策略 。 

1) 排序 策略 

假设 原始 子 名 (包括 待 证 明 合式 公式 的 否定 的 子 句 ) 称 为 0 层 归结 式 。(i 十 1) 层 的 归 
结 式 是 一 个 i 层 归 结 式 和 一 个 j(j 二 让 层 归 结 式 进行 归结 所 得 到 的 归结 式 。 

宽度 优先 就 是 先生 成 第 1 层 所 有 的 归结 式 , 然 后 是 第 2 层 所 有 的 归结 式 ,以 此 类 推 ， 
直到 产生 空子 句 结束 ,或 不 能 再 进行 归结 为 止 。 深 度 优先 是 产生 一 个 第 1 层 的 归结 式 , 然 
后 用 第 1 层 的 归结 式 和 第 0 层 的 归结 式 进行 归结 ,得 到 第 2 层 的 归结 式 , 直 到 产生 空子 句 
结束 ,否则 ,用 第 2 层 及 其 以 下 各 层 进行 归结 ,产生 第 3 层 ,以 此 类 推 。 

排序 策略 的 另 一 个 策略 是 单元 优先 Cunit preference) 策 略 , 即 在 归结 过 程 中 优先 考虑 
仅 由 一 个 文字 构成 的 子 句 , 这 样 的 子 句 称 为 单元 子 句 。 

2) 精确 策略 

精确 策略 不 涉及 被 归结 子 句 的 排序 ,它们 只 允许 某 些 归结 发 生 。 这 里 主要 介绍 3 种 
精确 归结 策略 。 

(1) 支持 集 (set of support) 策 略 。 

每 次 归结 时 ,参与 归结 的 子 句 中 至 少 应 有 一 个 是 由 目标 公式 的 否定 得 到 的 子 句 ,或 者 
是 它们 的 后 背 。 

所 谓 后 背 是 说 ,如 果 Qa2 是 al 与 男 外 某 子 句 的 归结 式 , 或 者 @a2 是 al 的 后 裔 与 其 
他 子 句 的 归结 式 , 则 称 a2 是 al 的 后 裔 ,cl 是 a2 的 祖先 。 

支持 集 策 略 是 完备 的 , 即 假如 对 一 个 不 可 满足 的 子 句 集合 运用 支持 集 策略 进行 归结 ， 
那么 最 终 会 导出 空子 句 。 

(2) 线性 输入 (linear input) 。 

参与 归结 的 两 个 子 句 中 至 少 有 一 个 是 原始 子 句 集中 的 子 句 (包括 那些 待 证 明 的 合式 
公式 的 否定 ) 。 

线性 输入 策略 是 不 完备 的 ,如 子 句 集合 {PVQ,PV ”Q:.”PVQ,PVYmQ)} 不 可 满 
足 , 但 是 无 法 用 线性 输入 归结 推出 。 

(3) 祖先 过 滤 (ancestry filtering) 。 

由 于 线性 输入 策略 是 不 完备 的 ,改进 该 策略 得 到 祖先 过 滤 策 略 : 参与 归结 的 两 个 子 
句 中 至 少 有 一 个 是 初始 子 句 集中 的 句子 ,或 者 一 个 子 句 是 另 一 个 子 句 的 祖先 ,该 策略 是 完 
备 的 。 


2.4.2 谓词 演算 中 的 归结 推理 
和 命题 演算 一 样 ,在 谓词 演算 中 也 具有 归结 推理 规则 和 归结 反 演 过 程 。 只 是 由 于 谓 


词 演算 中 量词 ,个 体 变 元 等 问题 ,使 得 谓词 演算 中 的 归结 问题 比 命题 演算 中 的 归结 问题 复 
杂 很 多 。 
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1. 子 句 型 

在 进行 归结 之 前 ,需要 把 合式 公式 化 为 子 句 式 。 

前 面 已 经 介绍 了 如 何 把 一 个 公式 化 成 前 柬 标准 型 (Qizi)…(Q,z,)M, 由 于 M 中 不 含 
量词 ,所 以 总 可 以 把 它 变换 成 合 取 范式 。 无 论 是 前 束 标准 型 ,还 是 合 取 范式 ,都 是 与 原来 
的 合式 公式 等 价 的 。 

对 于 前 束 范式 

(QT1)° (QT Mr 7 ) 
其 中 M(x ，… ,zz,) 表 示 M 中 含有 变量 x1 ,… ,zx, ,并 且 M 是 合 取 标准 型 。 今 Q, 是 (Qiz )… 
(Q,z,) 中 出 现 的 存在 量词 三 r<n) ,使 用 下 述 方法 可 以 消去 前 级 中 存在 的 所 有 量词 。 

。 若 在 Q, 之 前 不 出 现 全 称 量词 , 则 选择 一 个 与 M 中 出 现 的 所 有 常量 都 不 相同 的 新 

常量 c, 用 <c 代 蔡 M 中 出 现 的 所 有 zz, ,并 且 从 前 级 中 删 去 CQ.z，) 。 

。 若 Qa,…,Qu 是 在 Q. 之 前 出 现 的 所 有 全 称 量词 ,(1 志 51 志 52 志 … 志 sm 过 7), 则 选 

择 一 个 与 M 中 出 现 的 任 一 函数 符号 都 不 相同 的 新 mm 元 函数 符号 ,用 f(xa,…， 
xzm) 代 蔡 M 中 的 所 有 zz,, 并 且 从 前 级 中 删 去 (Qz,)。 

按 上 述 方法 删 去 前 级 中 的 所 有 存在 量词 之 后 得 到 的 公式 称 为 合式 公式 的 Skolem 标 
准 型 。 蔡 代 存 在 量化 变量 的 常量 c( 视 为 0 元 函数 ) 和 函数 三 称 为 Skolem 函数 。 

例 2.10 将 公式 

3zVyVz3 了 xyujjrP(z,yyzyuyuyw) 
转换 为 Skolem 标准 型 。 

式 中 , 3z 的 前 面 没 有 全 称 量词 ,在 了 x 的 前 面 有 全 称 量词 Yy 和 Y xz, 在 3w 的 前 面 
有 全 程 量词 VY y,V = 和 VY v。 所 以 ,在 PCz,yyz'xyuyzw) 中 ,用 常数 a 代替 z, 用 二 元 函 
数 /(y,z) 代 替 ,用 三 元 函数 g(y,z,u) 代 蔡 w, 去 掉 前 级 中 的 所 有 存在 量词 之 后 得 出 
Skolem 标准 型 : 

VyVzVvPlasy,z, f(y,2) ,vg (yz,0)) 

Skolem 标准 型 的 一 个 重要 性 质 如 下 。 

定理 2.20 令 S 为 公式 G 的 Skolem 标准 型 , 则 G 是 不 可 满足 的 , 当 且 仅 当 S 是 不 
可 满足 的 。 

证 明 : 不 妨 假定 G 已 经 是 前 束 范式 , 即 

G 一 (Qiz)…(Qzo)MCz Zn) 
设 Q.z, 为 前 级 中 的 第 一 个 存在 量词 。 令 
G1 =(V zx)(V 7) (Qizm) 
Ce NC ed Ca yy 
其 中 ,f(z ,… ,zx,-1) 是 对 应 zr 的 Skolem 函数 。 我 们 希望 证 明 G 是 不 可 满足 的 , 当 且 仅 
当 Gi 是 不 可 满足 的 。 

设 G 是 不 可 满足 的 。 若 G 是 可 满足 的 , 则 存在 某 定义 域 D 上 的 解释 I 使 Gi 按 了 为 

真 , 即 对 任意 xz1 ED,*…,z,-1€ED 
(QT QT Mri Tr fT Te ) Tr Ta) 
按 了 为 真 ,所 以 ,对 任意 xz1 ED,…,z,-1 ED, 都 存在 元 素 f(zx1，… ,zx,-1) 二 zx,ED, 使 


(Qaz) QT MT Tr Ts Tn Le) 
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按 了 I 为 真 ,那么 G 按 了 为 真 。 这 与 G 是 不 可 满足 的 假设 相 矛 盾 。 所 以 ,Gi 必 是 不 可 满 
足 的 。 
另 一 方面 , 设 G, 是 不 可 满足 的 。 车 G 是 可 满足 的 , 则 存在 某 定义 域 D 上 的 解释 了 ， 
使 G 按 了 I 为 真 , 即 对 任意 zi ED,…,z,_1ED, 都 存在 元 素 x,ED, 使 
(QT (QT MT Te Tr Tr Tn) 
按 了 为 真 。 扩 充 解释 了 ,使 得 包括 对 任意 z1 ED,…,zx,-1 ED, 把 (zi,…,x,-1) 映 射 成 
ZED 的 函数 f, 即 
(zzZr1) = 7 
扩充 后 的 解释 用 Ih 表示。 显然 ,对 任意 z1 ED,…,z,-1€ED 
(Qaza) QT I Mri Te fT TA ) Tr a) 
按 工 为 真 , 即 G11 了 = 二 TT, 这 与 G, 是 不 可 满足 的 假设 相 矛 盾 , 所 以 G 必 是 不 可 满足 的 。 
假设 G 中 有 m 个 存在 量词 。 令 Go 二 G, 设 Gi 是 在 Gi_!1 中 用 Skolem 函数 代替 其 中 第 
一 个 存在 量词 对 应 的 所 有 变量 ,并 且 去 掉 第 一 个 存在 量词 而 得 出 的 公式 , (hk 二 1,…,m)。 
显然 二 G,,。 与 上 面 的 证 明 相似 ,可 以 证 明 G,-1 是 不 可 满足 的 , 当 且 仅 当 Gx 是 不 可 满足 
的 (二 1,…,m)。 所 以 可 以 断定 ,G 是 不 可 满足 的 , 当 且 仅 当 S 是 不 可 满足 的 。 证 毕 。 
令 $S 为 公式 G 的 Skolem 标准 型 。 若 G 是 不 可 满足 的 , 则 G 等 价 于 S。 但 是 , 若 G 不 是 
不 可 满足 的 ,通常 G 并 不 等 价 于 S。 例 如 , 令 G=(3z)P(z), 则 S=P(la)。 设 解释 了 为 
定义 域 D={1,2), 则 G=(3 zx)P(z) ,等 价 于 P(1)VP(2)。 给 出 如 下 解释 。 
对 a 赋值 为 1; 对 谓词 已 赋值 : P(1) 为 下,P(2) 为 工 。 
显然 ,公式 G1/ 二 T, 但 S11 二 FF, 即 G 不 等 价 于 S。 
注意 ,一 个 公式 可 以 有 几 种 形式 的 Skolem 标准 型 。 应 该 使 用 变 元 数量 最 少 的 
Skolem 函数 。 因 此 ,在 化 为 前 束 标准 型 时 ,应 该 使 存在 量词 尽量 向 左 移 。 
例 2.11 将 合式 公式 化 为 子 句 形 。 
VxzLP(z) > [Vy[LP(y) > POCOFz,y))] A 7 Vy[LQ(z,y) 一 PCy)]]] 
解 : (1) 消 去 蕴涵 符号 : 
Vz[- Pr) V [VyL-PCy) V PCrzy))]AnmYy[nQc,y) V PCy)]]] 
(2)“ 一 ”内 移 : 
Vzx[-P(lzx) V [VyL -Ply) V PCFz,y))] 人 A3y>y[QGcz,y) A -7P(y)]]] 
(3) 变量 标准 化 ,使 不 同 量词 约束 的 变 元 有 不 同 的 名 字 : 
VxzL”P(z) V [VyL- PCy) V PCFz,y))] 人 3[QCzz) A -7P(w)]]] 
(4) 把 所 有 量词 都 集中 到 公式 左面 ,移动 时 不 改变 其 相对 顺序 : 
VrVyjwL -P(x) V [LPG) V PC(f(zx,y))] A [Q(zrsw) A -PC(w)]]] 
(5) 消去 存在 量词 
VzrVyL -Plz) V [LPGCD) V PCFGz,y))] 人 [QCzg(Czy)) 人 ”PCgCzyy))]]] 
(6) 把 母 式 化 为 合 取 范式 ， 
Vzyy[LmPCz) V PC) V PCFGzy))]A 人 [PCz) V Q(zr,g(r,y))] 
NL PC YY 二 PCg 人 zs 
(7) 隐 上 略 去 前 束 式 
[LPGz) V PC) V PCFCz,y))]A[”PCz) V Q(zr,g(r,y))] 
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从 上 一 PCz V 二 Peryy7)]] 
(8) 把 母 式 用 子 句 集 表 示 
{~P(z) V -PC(y) V P(f(z,y)), "P(r) V QCzg(Czy)) ,PCz) 
V -P(g(zr,y))} 
(9) 变量 分 离 标 准 化 。 于 是 有 : 
{P(xz)V ”PCy) V PO(f(z1 sy))s "P(rs) V Q(zs rg Crsy2)), "P(xs) 
V “P(g(zss%)))} 

必须 指出 ,一 个 子 句 内 的 文字 可 以 含有 变量 ,但 这 些 变 量 总 是 被 理解 为 全 称 量词 量化 
了 的 变量 。 

下 面 给 出 一 些 概念 。 不 含 变量 的 原子 称 为 基 原子 ;不 含 变 量 的 文字 称 为 基文 字 ; 不 含 
变量 的 子 句 称 为 基 子 句 ; 不 含 变 量 的 子 句 集 称 为 基 子 句 集 ;不 含 变 量 的 项 称 为 基 项 。 

如 果 一 个 表达 式 C 中 的 变量 被 不 含 变量 的 项 蔡 代 ,得 到 不 含 变量 的 基 表 达 式 C', 则 
称 C' 是 C 的 基 例 。 

另外 ,车 G 二 G1 和 Gs 和信 … 信 G, ,假设 G 的 子 句 集 为 Sc。 用 Si 表示 公式 Gi(1<i<n) 
的 子 句 集 , 令 5 二 S1U…US,, 可 以 证 明 G 是 不 可 满足 的 , 当 且 仅 当 S 是 不 可 满足 的 。 这 
样 ,对 Se 的 讨论 ,可 以 用 较为 简单 的 S 代替 ,为 了 方便 ,也 称 S 为 G 的 子 句 集 。 

2. 置换 和 合 一 

对 命题 迎 辑 应 用 归结 原理 的 重要 步骤 是 在 一 个 子 句 中 找 出 与 男 一 子 句 中 的 某 个 文字 
互补 的 文字 。 当 子 句 中 含有 变量 时 ,要 先 讨论 置换 和 合 一 。 如 研究 子 句 

Ci = P(xz)V Q(z), C= ~-P(f(y)) V R(y) 
Ci 中 没有 文字 与 C: 中 的 任何 文字 互补 。 但 是 , 若 在 Cl 中 用 fa) 置 换 z, 在 C* 中 用 w 置 
换 y, 便 得 出 
Ci = P(f(a)) V QC(fla)), C's 一 ”PCFa)) V R(a) 
其 中 ,PC(f(a)) 和 一 PC(f(a)) 是 互补 的 。 可 以 得 出 Cl 和 C's 的 归结 式 : 
C's = Qf(a)) V Ra) 

注意 ,C1 和 C', 分 别 是 Cl 和 Cs 的 基 例 。 从 上 述 例子 可 以 看 到 ,用 适当 的 项 置换 C, 和 
Cs 的 变量 可 以 产生 新 子 句 。 

定义 2.24 置换 是 形 为 

{1 /v1 ts /vs ty 

的 有 限 集 合 , 其 中 vw,… ,vw 是 互 不 相同 的 变量 ,i; 是 不 同 于 wi 的 项 (可 以 为 常量 .变量 、 函 
数 )(1 达 i 过 n)。Li/vi 表示 用 4; 置换 vi, 不 允许 与 v; 相同 ,也 不 允许 vi 循环 地 出 现在 另 
一 个 与 中 。 

当 乒 ,是 基 项 时 ,置换 称 为 基 置 换 。 不 含 任何 元 素 的 置换 称 为 空置 换 , 用 * 
表示 。 

例如 : {a/z,g(5)/y,f(g(c))/z} 就 是 一 个 置换 。 

定义 2.25 令 0={4/vistz/ve，…,t,/v,) 为 置换 ,FE 为 表达 式 。 设 E40 是 用 项 1; 同时 
代替 EE 中 出 现 的 所 有 变量 v;(1 志 i<n) 得 出 的 表达 式 。 通 常 称 E90 为 EE 的 例 。 

例 2.12 令 9={a/z,f(6)/y,g(c)/z} 

E= P(xz,y,z) 
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则 有 E09=P(a,f(b),g(c)) 
定义 2.26 令 b 王 全/zi ti/T} ,A= {uf/ yo dn/ ym} 
为 两 个 置换 。0 和 4 复合 也 是 一 个 置换 ,用 0-X 表示 , 它 由 在 集合 : 
{A/zi 9 tA /Ta /yn Yn) 
中 删除 下 面 两 类 元 素 得 出 ; 
Wu/yi Sy: € {x1 Tn} 
tA/vis 当 tA = vo 
例 2.13 令 90={f(y)/zr,z/y} ,A={a/r,b/y,y/z} 
在 构造 0-X 时 ,首先 建立 集合 
{f(A/z A /yra/rT bb/ yy/z} 
由 于 忌 一 y, 所 以 要 删除 2/y。 上 述 集合 中 的 第 三 .四 元 素 中 的 变量 z,y 都 出 现在 
{zyy} 中 ,所 以 还 应 删除 ea/z,p/y。 最 后 得 出 
0°4= {f(0)/zr,y/z} 
不 难 验 证 出 置换 有 下 述 性 质 。 
(1) 空置 换 e 是 左 么 元 和 右 么 元 , 即 对 任意 置换 0, 恒 有 
e°0=0.e=0 
(2) 对 任意 表达 式 瓦 , 恒 有 E(0°4) 二 (E090)4。 
(3) 若 对 任意 表达 式 玉 恒 有 E090 二 EX, 则 0=X4。 
(4) 对 任意 置换 0,4,y, 恒 有 
(0°A) p=0° (Aep) 
即 置换 的 合成 满足 结合 律 。 
(5) 设 A 和 B 为 表达 式 集合 , 则 
(AUB)=A0UB 
注意 ,置换 的 合成 不 满足 交换 律 。 
定义 2.27 若 表 达 式 集合 {FE ,…',E} 存 在 一 个 置换 0 使 得 
E10=… = E0 
则 称 集合 {El ,…',Ee} 是 可 合 一 的 ,置换 0 称 为 合 一 置换 。 
例 2.14 集合 {P(a,y),P(z,f(5))} 是 可 合 一 的 ,因为 0={a/z,f(6)/y} 是 它 的 合 
一 置换 。 
例 2.15 集合 {P(z),P(CF(y))} 是 可 合 一 的 ,因为 0={J(Ca)/zya/y} 是 它 的 合 一 置 
换 。 另 外 ,0 三 {7Cy)Vz} 也 是 一 个 合 一 置换 ,所 以 合 一 置换 是 不 唯一 的 。 但 是 ,0 比 0 更 
一 般 , 因 为 用 任意 一 个 常量 置换 y 都 可 以 得 一 个 置换 ,因而 可 得 到 无 穷 个 基 置 换 。 
定义 2. 28 表达 式 集合 {EE ,…,E) 的 合 一 置换 6 是 最 一 般 的 合 一 置换 (most 
general unifier, mgu) , 当 且 仅 当 对 该 集合 的 每 个 合 一 置换 0 都 存在 置换 4 ,使 得 0 二 6°4。 
例如 ,在 例 2.15 中 ,mgu6= 二 9 = 二 {f(y)/z), 但 0={f(aQ)/zrwa/y} 不 是 mgu。 
例 2.16 求 表达 式 集合 {P(z) .PCy)} 的 mgu。 
显然 ,{y/z} 与 14z/y} 都 是 该 集合 的 mgu。 这 也 说 明 mgu 一 般 情况 下 也 不 是 唯一 的 ， 
但 是 它们 除了 相差 一 个 换 名 以 外 ,其 他 是 相同 的 。 
在 人 工 智能 中 , 合 一 起 着 非常 重要 的 作用 , 它 是 区 别 专家 系统 和 简单 的 判定 树 的 特征 
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之 一 。 没 有 合 一 ,规则 的 条 件 元 素 只 能 匹配 常数 ,这样 就 必须 为 每 一 个 可 能 的 事实 写 一 条 
专门 的 规则 。 

3. 合 一 算法 

本 节 将 对 有 限 非 空 可 合 一 的 表达 式 集合 给 出 求 取 最 一 般 合 一 置换 的 合 一 算法 。 当 集 
合 不 可 合 一 时 ,算法 也 能 给 出 不 可 合 一 的 结论 ,并 且 结束 。 

考虑 集合 {P(a) ,PCz)}。 为 了 求 出 该 集合 的 合 一 置换 ,首先 找 出 两 个 表达 式 的 不 一 
致 之 处 ,然后 再 试图 消除 。 对 P(a) 和 P(z) ,不 一 致 之 处 可 用 集合 fae,z} 表 示 。 由 于 工 是 
变量 ,可 以 取 = {a/z} ,于 是 有 

P(a)0 = P(x)0 = Pla) 

即 0 是 {P(a) ,P(x)} 的 合 一 置换 。 这 就 是 合 一 算法 依据 的 思想 。 在 讨论 合 一 算法 之 前 ， 
先 讨 论 差 异 集 的 概念 。 

定义 2.29 表达 式 的 非 空 集合 W 的 差异 集 是 按 下 述 方法 得 出 的 子 表达 式 的 集合 。 

(1) 在 W 的 所 有 表达 式 中 找 出 对 应 符号 不 全 相同 的 第 一 个 符号 ( 自 左 算 起 ) 。 

(2) 在 W 的 每 个 表达 式 中 提取 出 占有 该 符号 位 置 的 子 表 达 式 。 这 些 子 表达 式 的 集 
合 便 是 W 的 差异 集 了。 

例 2.17 求 下 面 集合 的 差异 集 : 

W= {P(r,f(y,z)), P(rx,a), P(r,g(h(k(x))))} 

解 : 在 W 的 3 个 表达 式 中 ,前 4 个 对 应 符号 一 一 “PCz,” 是 相同 的 ,第 5 个 符号 不 全 
相同 ,所 以 W 的 不 一 致 集合 为 {f(y,z),a,g(h(k(z)))}。 

假设 D 是 W 的 差异 集 , 则 有 结论 : 

(1) 若 D 中 无 变量 符号 , 则 W 是 不 可 合 一 的 。 

(2) 若 D 中 只 有 一 个 元 素 , 则 W 是 不 可 合 一 的 。 

(3) 若 D 中 有 变量 符号 x 和 项 4, 且 之 出 现在 1 中 , 则 W 是 不 可 合 一 的 。 

下 面 给 出 合 一 算法 。 

合 一 算法 : 

第 1 步 置 k=0,W==W ,6 二 e。 

第 2 步 车 W 中 只 有 一 个 元 素 , 终 止 ,并 且 6 为 W 的 最 一 般 合 一 ,否则 求 出 Wi 的 
差异 集 D，。 

第 3 步 若 Di 中 存在 元 素 v 和 i, 并 且 vi 是 不 出 现在 i 中 的 变量 , 则 转向 第 4 步 ， 
否则 终止 ,并 且 W 是 不 可 合 一 的 。 

第 4 步 置 2 二 2/ We 一 We/w}( 记 Was 为 Wei)。 

第 5 步 置 kk 十 1, 转 向 第 2 步 。 

注意 : 在 第 3 步 ,要 求 w 不 出 现在 i 中 ,这 称 为 occur 检查 ,算法 的 正确 性 依赖 于 它 。 
例如 ,假设 WW 二 {P(z,z),P(y,f(y))} ,执行 合 一 算法 ,结果 如 下 。 

(1) Do={zx,y}。 

(2) B={y/z} ,Wa ={P(y,y),P(y, f(y))}, 

(3) DD 二 {fy,f(y)), 因 为 y 出 现在 f(y) 中 ,W 不 可 合 一 。 但 是 ,如 果 不 做 occur 检 
查 , 则 算法 不 能 停止 。 
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例 2.18 求 出 
W= {Pla,r,f(g(y))),P(z, f(z),f(u))} 
的 最 一 般 合 一 。 
(1) 6 =e,W,=W. 
(2) Wo 未 合 一 ,差异 集合 为 D。 二 {a,z}。 
(3) D。 中 存在 变量 w 王 > 和 常量 46 二 a。 
(4) 令 人 一 9。(a/z) 一 {a/z} 
Wi= {Pla,zr, f(g(y))),P(z, f(z),f(u))} {a/z} 
= {Pl(a,z,f(g(y))),Pl(a, f(a),f(u))} 
(2') Wi 未 合 一 ,差异 集合 为 Di 二 {x ,f(a)}。 
(3') D, 中 存在 元 素 v= 二 zx,4 二 f(a), 并 且 变 量 z 不 出 现在 / (a) 中。 
(4 ) 令 6,=6°{f(a)/zr}={a/z, f(a) /zr} 
Ws= {Pla,sz, f(g(y))), Pla, fla), fu)}{ f(a) /zr} 
= {Pla,fla) ,f(g (3y))) ,Pla, fla),f00)} 
(2 ) Ws 未 合 一 ,差异 集合 为 D, = 二 {g(y),u})。 
(3”) D, 中 的 变量 v= 二 不 出 现在 4 二 gC(y) 中 。 
(4) 仿 6,=6.°{g(y)/u}={a/z, fla)/zr,g(y)/u} 
Ws= {Pla,sfla) ,flg(y))) ,Pla, fla) ,FrGo)) {gy)/u} 
= {Pla, f(a), /f(g(y)))} 
(2 ) Ws 中 只 含 一 个 元 素 , 所 以 
6s = {a/z, f(a)/r,g(y)/u} 
是 W 的 最 一 般 合 一 ,终止 。 
注意 ,上 述 合 一 算法 对 任意 有 限 非 空 的 表达 式 集合 总 是 能 终止 的 ,否则 将 会 产生 有 限 
非 空 表达 式 集合 的 一 个 无 穷 序列 6, ,Ws ,W;,，… ,该 序列 中 的 任 一 集合 W;,, 都 比 相 应 的 
集合 W; 少 含 一 个 变量 ( 即 W ,含有 ,但 W;,, 不 含 忆 )。 由 于 W 中 只 含有 限 个 不 同 的 
变量 ,所 以 上 述 情况 不 会 发 生 。 
定理 2.21 若 W 为 有 限 非 空 可 合 一 表达 式 集合 , 则 合 一 算法 总 能 终止 在 第 2 步 上 ， 
并 且 最 后 的 6 便 是 W 的 最 一 般 合 一 (mgu) 。 
4. 归结 式 
定义 2.30 若 由 子 句 C 中 的 两 个 或 多 个 文字 构成 的 集合 存在 最 一 般 合 一 置换 9, 则 
称 C6( 记 为 C;) 为 C 的 因子 。 若 C; 是 单位 子 句 , 则 称 它 为 C 的 单位 因子 。 
例 2.19 令 C=P(z)VP(f(y)V -Q(z) 
由 C 中 前 两 个 文字 构成 的 集合 {P(z),P(CFCy))} 存 在 最 一 般 合 一 置换 6 二 {f(y)/zx)， 
所 以 
C= P(fOW)V 一 QCFCy)) 
是 C 的 因子 。 
定义 2.31 令 C 和 C: 为 两 个 无 公共 变量 的 子 句 ,Li 和 上 工 ; 分 别 为 C 和 Cs 中 的 两 
个 文字 。 若 集合 {Li, "L;}) 存 在 最 一 般 合 一 置换 8, 则 子 句 
(Ci — {Lia}) U (Czs — {Lzs}) 
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称 为 C! 和 C: 的 二 元 归结 式 。 文字 L 和 工 ; 称 为 被 归结 的 文字 。 

例 2.20 令 

GC=P(r)VQ(z) C= -~P(a)V R(z) 
因为 C, 和 C, 中 都 出 现 变量 zx, 所 以 重新 命名 C。 中 的 变量 , 取 
C:: -Pla) VRCy) 
选择 Li 二 P(xz) ,Ls 二 -了 Pla), 则 {Li ,一 Ls)= 二 {P(a),P(z)} 存 在 最 一 般 合 一 置换 6 二 {a/ 
zx} ,于 是 有 
(Ce 一 {Le)) U (Cs — {Lz2s}) 
= ({P(a),Q(a)} — {PO})) U ({ -PCa) ,RD 一 { PCo))) 
{Q(a)} U {R(y)} 
= {Q(a),R(y)} 

Qla) VR(y) 便 是 C 和 Cs 的 二 元 归结 式 。P(x) 和 一 P(a) 称 为 被 归结 的 文字 。 

定义 2.32 子 句 C, 和 C* 的 归结 式 是 下 述 某 个 二 元 归结 式 。 

(1) C 和 C; 的 二 元 归结 式 。 

(2) C 的 因子 和 C。 的 二 元 归结 式 。 

(3) Cs 的 因子 和 Ci 的 二 元 归结 式 。 

(4) Ci 的 因子 和 Cs。 的 因子 的 二 元 归结 式 。 

例 2.21 令 Ci=POz)VPCFCD))VRCC)),C 一 PCOFCsCo))VQCOD) 

C=PCFCD))VR(CsC) 是 Ci 的 因子 ,C， 和 C 的 二 元 归结 式 为 RegCsCo)))VQ(C)， 
所 以 Cl 和 C 的 归结 式 为 RsCeCa)))VQ(CO) 。 

此 外 , 若 取 C 中 的 文字 蕊 ,=P(Cz) ,C: 中 的 文字 ”PCFCg(a))), 则 {Li,”L:)} 存 在 最 
一 般 合 一 置换 


6= {f(g(a))/z} 
于 是 P(A(y))V R(g(y))V QCD) 也 是 Cl 和 C; 的 归结 式 。 
5. 归结 反 演 
和 命题 巡 辑 一 样 ,谓词 逻辑 的 归结 反 演 也 是 仅 有 一 条 推理 规则 的 问题 求解 方法 ,为 证 
明 A 一 B, 其 中 A、B 是 谓词 公式 。 使 用 反 演 过 程 , 先 建立 合式 公式 : 
G=AA-B 
进而 得 到 相应 的 子 句 集 S, 只 需 证 明 S 是 不 可 满足 的 即 可 。 
例 2.22 “ 某 些 患 者 喜欢 所 有 医生 。 没 有 患者 喜欢 庸 医 。 所 以 没有 医生 是 庸 医 。” 
该 例子 的 谓词 在 例 2.4 中 已 做 了 定义 和 表示 , 即 
Ai: (3z)(P(z) A (VY) DG(y) >L(z,y))) 
Azs: (VYz)(P(z) 一 (Vy)(QCy) > nL(r,y))) 
G: (VA) (D(x) > 7Q(7)) 
目的 是 证 明 G 是 A, 和 A; 的 逻辑 结论 , 即 证 明 A, A, A ”G 是 不 可 满足 的 。 首 先 
求 出 子 句 集合 : 
Ai: (Jz) (P(x) A (Vy Dy) >L(r,y))) 
(Iz)(VY Pr) 人 (DCy) V Lr,y))) 
Skolem 化 : (Vw) (Pla) A (7D(y) V Lla,y))) 
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Az: (Vz)(P(z) > (Vy)(Q(y) 一 ELCzyy))) 
=> (VI)(TP(r) V (CVy)CnQCOD) V ”LCzyy))) 
=> (VI(VY (P(r) V ("QCY) V L(x,y))) 
DC 
=>> (jz)(D(z) A Q(z)) 
Skolem 化 : (D(5) 人 Q(b)) 
因此 A 人 A; 人 =-G 的 子 句 集合 S 为 
S= {P(a),-"D(y) V L(a,y), "P(x) V ”QCO) V L(x,y),D(b) ,QD))} 
归结 证 明 S 是 不 可 满足 的 : 
(1) Pla) 
(2) -2 D(y) VL(a,y) 
(3) ”PCz)V "7Q(YV "L(x,y) rsS 














(4) DCO) 

(5) QCO) 

(6) Lay0O) 由 第 (2) (4) 句 归结 得 到 
(7) ”~QCD)V ”Layy) 由 第 (1)、(3) 句 归结 得 到 
(8) -=L(a,b) 由 第 (5) (7) 句 归结 得 到 
(9) 由 第 (6) (8) 句 归结 得 到 
6. 答案 的 提取 


归结 反 演 不 仅 可 用 于 定理 证 明 ,而 且 也 可 用 来 求 取 问 题 的 答案 ,其 思想 与 定理 证 明 类 
似 。 方 法 是 在 目标 公式 的 否定 形式 中 加 上 该 公式 否定 的 否定 ,得 到 重 言 式 ; 或 者 再 定义 一 
个 新 的 谓词 ANS, 加 到 目标 公式 的 否定 中 。 把 新 形成 的 子 句 加 到 子 句 集中 进行 归结 。 

例 2.23 已 知 张 (Zhang) 和 李 (Li) 是 同班 同学 ,如 果 z 和 > 是 同班 同学 , 则 xz 上课 的 
教室 也 是 y 上 课 的 教室 。 现 在 张 在 Room11, 问 李 在 哪里 上 课 ? 

解 : 首先 定义 谓词 如 下 。 

CCz,y): 工 和 y 是 同班 同学 

At(z,w): 蔗 在 w 教室 上 课 





已 知 前 提 可 表示 为 
Cl(Zhang ,Li) 
VzrVyVulCl(r,y) M At(rsu) > At(y,u)) 
At(Zhang ,Room11) 


目标 公式 的 否定 为 : ” 3 vAi(Li,v) 
目标 采用 重 言 式 的 方式 ,得 到 子 句 集合 : 
S={C(Zhang ,Li), CCzy) V TAt(zsu) V At(y,u) ,Art(Zhang ,Room ll)， 
TAL(Li,v) VA(C,u)) 
归结 过 程 如 下 。 
(1) CCZhazg ,Li) 
(2) ”CCz,y)V TT Aizu V At(ysu) 5 
(3) Ar(Zhang ,Roomll) 
(4) ”AiCLio)VALLiu) 
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(5) At(Li,v)V "C(x,Li)V ALCzyu) (2)、(4) {Li/y,v/u} 
(6) At(Li,v)V “Ai(Zhang,v) (1) (5) {Zhang/z} 
(7) Ar(Li,Room!11) (3)、(6) {Room11/v} 


最 后 就 是 得 到 的 答案 : 李 在 Room11。 
2.4.3 谓词 演算 归结 反 演 的 合理 性 和 完备 性 


归结 原理 是 反 演 完备 的 , 即 如 果 一 个 子 句 集合 是 不 可 满足 的 , 则 归结 将 会 推导 出 矛 
盾 。 归 结 不 能 用 于 产生 某 子 句 集合 的 所 有 结论 ,但 是 它 可 用 于 说 明 某 个 给 定 的 句子 是 该 
子 句 集合 所 蕴涵 的 。 因 此 ,使 用 前 面 介绍 的 和 否定 目标 的 方法 ,可 以 发 现 所 有 的 答案 。 

1. Herbrand 域 和 Herbrand 解释 

在 归结 反 演 中 ,为 了 证 明 A 为 G 的 结论 ,把 A 的 否定 命题 2A 加 入 G 中 .证明 GA -A 
的 子 句 集合 S 不 可 满足 , 即 对 于 所 有 定义 域 上 所 有 可 能 的 解释 ,GA ~A 均 取 假 值 。 因 为 
合式 公式 的 解释 有 无 穷 多 种 ,所 以 研究 所 有 定义 域 上 的 所 有 解释 是 不 可 能 的 。 如 果 说 对 
于 一 个 具体 的 谓词 公式 ,能 够 找到 一 个 比较 简单 的 特殊 论 域 ,使 得 只 要 在 这 个 论 域 上 该 公 
式 是 不 可 满足 的 , 便 能 保证 该 公式 在 任 一 论 域 上 也 是 不 可 满足 的 ,那么 这 个 问题 就 会 简单 
很 多 。 下 面 将 证 明 , 的 确 存在 这 种 定义 域 (Herbrand 域 , H 域 ), 如 果子 句 集合 S 是 不 可 
满足 的 , 当 且 仅 当 对 瓦 上 的 所 有 解释 ,S 的 真 值 都 为 假 。Herbrand 域 可 定义 如 下 。 

定义 2.33 设 S 为 子 句 集合 ,S 的 理 域 及 (S) 可 定义 如 下 。 

(1) S 中 的 一 切 常量 字母 均 出 现在 瑟 (S) 中 , 若 S 中 无 任何 常量 字母 , 则 命名 一 个 常 
量 字 母 a, 使 得 a€ H(S)。 

(2) 车 项 44,… ,4,EHCS), 则 户 (44,… ,1,)EH(S), 其 中 /为 S 中 的 任意 函数 。 

(3) 有 H(S) 中 的 项 仅 由 (1),(2) 形 成 。 

为 了 讨论 子 句 集 S 在 互 域 上 的 真 值 ,引入 妃 域 上 S 的 原子 集 A , 它 是 S 中 谓词 公式 
的 实例 集 。 

定义 2.34 设 S 是 子 句 集 , 对 应 的 瑟 域 上 的 原子 集 A 为 所 有 出 现在 S 中 的 原子 谓 
词 公式 的 实例 。 

(1) 如 果 原 子 谓词 公式 为 命题 (不 包含 变量 ) , 则 其 实例 就 是 其 本 身 。 

(2) 若 原子 公式 形 如 PC4,… ,1,) ,i 为 变量 (i 二 1,2,…,n), 则 其 实例 就 是 用 S 的 五 
域 中 的 元 素 代替 4 ,… ,i 形成 的 。 

定义 2.35 子 句 集合 S 中 的 子 句 C 的 基 例 是 用 S 的 Herbrand 域 中 的 元 素 代替 C 
中 的 变量 得 出 的 子 句 。 

由 于 原子 集中 的 元 素 都 是 原子 命题 ,给 每 个 元 素 指派 一 个 真 值 (T 或 F) ,就 可 以 建立 
子 句 集 在 娓 域 上 的 一 个 解释 , 记 为 三。 

令 A={Ai,…,A…}) 为 S 的 原子 集合 。 正 解释 三 可 以 很 方便 地 用 集合 

T = {ms me} 

表示 ,其 中 mi 或 为 A;, 或 为 -了 Ai(i 二 1,2,…) ,车 mi 为 A;, 则 A; 的 真 值 为 工 ,否则 A; 的 
真 值 为 F, 即 
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1A， 当 A; 被 指定 为 T 
a 当 A; 被 了 指定 为 下 

子 句 集合 S 的 任意 解释 不 一 定 是 定义 在 S 的 Herbrand 域 上 的 ,所 以 一 个 解释 可 以 
不 是 电解 释 。 但 是 ,对 于 子 句 集 S 的 任 一 可 能 论 域 了 的 任 一 解释 工 ,总 能 在 S 的 互 域 上 
构造 一 个 对 应 的 及 解释 1* ,使 子 句 集 具有 相同 的 真 值 。 构 造 方法 如 下 。 

今 P 为 S 中 的 任 一 n 元 谓词 符号 ,hi ,…,h, 是 S 的 Herbrand 域 中 的 任意 元 素 。 将 
每 个 h; 按 了 映射 为 D 中 的 某 元 素 d;(1 达 i 过 n)。 如 果 P(d1,…,d,) 按 了 的 真 值 为 T( 或 
F) , 则 PChi,…,h,) 按 了 的 真 值 为 (或 F)。 

I 和 I* 有 如 下 性 质 。 

。 若 某 定义 域 D 上 的 解释 I 满足 子 句 集合 S, 则 与 相对 应 的 任 一 五 解释 1* 也 满 

足 S。 

。 子 句 集合 S 是 不 可 满足 的 , 当 且 仅 当 S 在 S 的 所 有 互 解释 下 都 为 假 。 

这 些 性 质 将 S 在 一 般 论 域 D 上 的 不 可 满足 问题 缩小 成 了 可 数 集 瓦 上 的 不 可 满足 
问题 。 

2. 语义 树 

由 五 解释 的 定义 可 以 看 出 ,通常 子 句 集合 S 的 昌 解释 的 个 数 是 可 数 的 ,这 样 可 以 使 
用 “语义 树 ” 枚 举 出 S 的 所 有 可 能 的 互 解释 ,形象 地 描述 子 句 集 在 瓦 域 上 的 所 有 解释 ,以 
观察 每 个 分 枝 对 应 的 S 的 逻辑 真 值 是 真 还 是 假 。 

当 子 句 集 包 含 的 原子 公式 均 为 命题 时 ,其 原子 集 是 有 限 集 , 则 很 容易 画 出 完整 的 语 
义 树 。 

例 2.24 令 A={P,Q,R}) 是 子 句 集合 S 的 原子 集合 。 画 出 其 语义 树 。 

由 于 每 个 基 原 子 只 可 能 有 两 个 真 值 (T 和 F) ,所 以 很 容易 以 二 又 树 的 形式 建立 语义 
树 , 图 2-3 所 示 的 就 是 S 的 完整 的 语义 树 。 

从 图 2-3 上 可 以 看 出 ,从 树 根 结 点 no 到 叶 结 点 n 的 路 径 就 指示 了 一 个 解释 , 记 为 
IT(n) ,其 表示 为 路 径 上 标记 的 集合 ,每 个 标记 是 一 个 文字 。 例 如 ,T(ns) 二 {P,Q, 一 R}。 
可 以 对 语义 树 指示 的 每 个 解释 ,判别 子 句 集 的 真 假 性 ,进而 判别 子 句 集 的 永 真 、 可 满足 ,还 
是 不 可 满足 。 


(i=1,2,°") 





图 2-3 完全 语义 树 


对 于 一 般 的 子 句 集 , 互 是 可 数 无 穷 集 .从 而 相应 的 语义 树 也 可 能 成 为 一 棵 无 穷 树 。 
例 2.25 研究 S={P(z)VQ(f(z)), 了 Pl(a), 了 了 Q(y))。S 的 原子 集合 为 
A= {P(a),Q(a),P(f(a)) QC)) ,PCFCFCa)))，…》 
图 2-4 所 示 的 是 S 的 一 个 无 限 语义 树 。 
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对 无 穷 语义 树 ,如 果子 句 集 是 不 可 满足 的 , 则 不 必 无 限 地 扩展 语义 树 , 就 可 以 确定 语 
义 树 上 的 所 有 路 径 都 分 别 对 应 一 个 导致 子 句 集 不 可 满足 的 解释 ,这 样 的 语义 树 称 为 封闭 
语义 树 。 对 于 图 2-4 所 示 的 无 限 语 义 树 ,其 封闭 语义 树 如 图 2-5 所 示 。 





图 2-4 无 限 语义 树 图 2-5 封闭 语义 树 


首先 看 根 结 点 no , 它 表示 没有 任何 解释 ,显然 S 中 的 子 句 无 法 确定 其 真 假 值 (除非 是 
永 真 式 或 永 假 式 在 不 需要 任何 解释 的 时 候 可 以 确定 真 假 值 ) 。 

接着 看 结 点 ma ,对 mom 分 枝 所 标记 的 PCa) 指 派 真 值 ,如 果 P(Ca) 指 派 为 工 , 子 句 
了 P(a) 为 ,从 而 使 子 句 集 S 不 满足 ; 像 这 样 ,从 根 结 点 no 到 结 点 ma 的 赋值 使 得 子 句 集 
不 满足 ,而 根 结 点 mo 无 法 确定 子 句 集 是 否 可 满足 , 结 点 mu 称 为 失败 结 点 ,这 里 用 XX 表示 。 
如 果 P(a) 指 派 为 下 ( 结 点 ms), 则 S 中 没有 一 个 子 句 的 真 值 是 可 以 确定 ,还 需要 看 其 他 原 
子 的 真 值 指派 ,所 以 mm? 不 是 失败 结 点 。 

对 Q(a) 指 派 为 真 值 , 如 果 Q(a) 指 派 为 , 则 子 句 了 QCy) 为 F( 注 意 ,变量 y 受 全 称 变 
量 的 约束 ), 则 no 为 失败 结 点 ;如 果 Q(a) 指 派 为 F, 则 S 中 同样 也 没有 一 个 子 句 的 真 值 是 
可 以 确定 的 ,还 需要 看 其 他 原子 的 真 值 指 派 。 

接着 给 P(/(a)) 指 派 真 值 ,无 论 是 指派 ,还 是 指派 F, 都 无 法 使 S 中 的 子 句 确定 其 
真 假 ,所 以 na .ns 都 不 是 失败 结 点 。 给 Q(/(a)) 指 派 真 值 ,看 结 点 mw,Q(/(a)) 指 派 为 
T, 这 时 了 Q(y) 为 F( 只 要 将 y 置换 为 /(a)), 所 以 nw 为 失败 结 点 。 当 Q(/(a)) 指 派 为 F 
时 ,PCz)VQCAFCz)) 为 F( 只 要 将 工 置 换 为 wa), 所 以 m4 也 为 失败 结 点 。 同 样 ,可 以 确定 
ms 4 都 是 失败 结 点 。 至 此 可 以 生成 如 图 2-5 所 示 的 封闭 语义 树 。 因 此 ,可 以 说 封闭 语 
义 树 就 是 每 个 分 枝 都 有 失败 结 点 的 语义 树 。 

从 上 面 可 以 看 出 ,语义 树 中 每 一 个 导致 子 句 集 S 不 可 满足 的 路 径 ( 对 应 于 互 域 上 的 
一 个 解释 ) 都 至 少 引 起 一 个 子 句 的 基 例 为 下 ,例如 : 

IT(mz) = {7 P(a), "Qa),P(f(a)), "Qf (a))} 

使 得 子 句 P(z) V QCf(z)) 的 基 例 Pla)V Q(f/(a)) 为 假 。 当 建立 一 棵 封闭 语义 树 时 , 实 
际 上 也 就 建立 了 一 个 由 有 限 个 不 可 同时 满足 的 基 例 构成 的 集合 S’。 

3. Herbrand 定理 

在 上 述 研究 工作 的 基础 上 ,Herbrand 提出 了 Herbrand 定理 ,该 定理 是 符号 逻辑 中 的 
重要 定理 , 它 是 机 器 定理 证 明 的 基础 。 由 前 面 的 互 解释 的 性 质 知 道 , 若 子 句 集合 S 按 它 
的 任 一 瑟 解释 都 为 假 ., 则 可 以 断定 S 是 不 可 满足 的 。 通 常 S 的 互 解释 的 个 数 是 可 数 个 ， 
可 以 使 用 语义 树 组 织 它们 。 

定理 2.22( 工 型 Herbrand 定理 ) 
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子 句 集合 S 是 不 可 满足 的 , 当 且 仅 当 相应 S 的 每 个 完全 语义 树 都 存在 有 限 封闭 的 语 
义 树 。 

证 明 : 设 S 是 不 可 满足 的 。 令 了 为 S 的 任 一 完全 语义 树 。 

对 工 中 由 根 结 点 出 发 的 到 达 任 一 叶 结 点 的 路 径 妃 , 令 I 为 对 应 B 分 枝 上 S 的 一 个 
解释 。 因 为 S 是 不 可 满足 的 ,Is 必 使 得 S 中 某 子 句 C 的 一 个 基 例 C 为 假 。 然 而 ,由 于 C” 
是 有 限 的 ,这 样 路 径 B 上 必 存 在 一 个 失败 结 点 Na 。 
因为 了 的 每 条 这 样 的 路 径 上 都 有 一 个 失败 结 点 ,因此 S 存在 封闭 的 语义 树 T 。 

反之 ,车 相应 S 的 每 个 完全 语义 树 都 存在 一 个 有 限 封闭 语义 树 , 则 其 中 由 根 结 点 出 
发 的 每 条 路 径 都 含有 失败 结 点 。 因 为 S 的 任 一 解释 都 对 应 T 的 某 一 分 枝 , 这 说 明 每 个 解 
释 都 使 得 S 的 某 个 子 句 的 基 例 为 假 。 所 以 S 是 不 可 满足 的 。 证 毕 。 

定理 2.23( 呈 型 Herbrand 定理 ) 子 句 集合 S 是 不 可 满足 的 , 当 且 仅 当 存在 不 可 满 
足 的 S 的 有 限 基 例 集 S'。 

下 型 Herbrand 定理 提出 了 一 种 反驳 程序 , 即 给 定 一 个 欲 证 明 的 不 可 满足 的 子 句 集 
合 S, 若 存在 机 械 程序 能 逐次 产生 S 中 子 句 的 基 例 的 集合 S',,S'1,…, 并 且 能 逐次 检验 
S,S 1 ,… 的 不 可 满足 性 , 则 由 Herbrand 定理 可 知 ,能 找 出 一 个 有 限 的 ,使 Sn 是 不 可 
满足 的 。 

这 种 方法 效率 比较 低 , 即 使 对 只 有 10 个 两 文字 基 子 句 的 情况 也 有 2" 个 合 取 式 。 所 
以 ,化 成 析 取 范式 并 不 是 好 的 方法 ,为 此 可 以 采用 下 面 的 规则 简化 计算 过 程 。 

1) 重 言 式 规则 

设 从 子 句 集合 S 中 删除 所 有 重 言 式 得 出 子 句 集合 S', 则 S 是 不 可 满足 的 , 当 且 仅 当 
S 是 不 可 满足 的 。 

2) 单 文字 规则 

如 果 在 子 句 集 S 中 存在 只 有 一 个 文字 的 基 子 句 世 ,删除 S 中 包含 工 的 所 有 基 子 句 得 
S'。 则 @ 若 S 是 空 的 , 则 S 是 可 满足 的 ; @ 若 S' 非 空 ,在 S' 中 删除 所 有 文字 ” 工 得 S”, 则 
S 不 可 满足 当 且 仅 当 S “不 可 满足 。 

3) 纯 文 字 规 则 

当 文字 工 出 现 于 S 中 ,而 ” 工 不 出 现 于 S 中 , 便 说 工 为 S 的 纯 文字 。 

如 果 S 中 的 文字 工 是 纯 的 ,删除 S 中 所 有 包含 工 的 基 子 句 得 S , 则 四 若 S 是 空 集 ， 
则 S 可 满足 ; @ 若 S' 非 空 , 则 S 不 可 满足 , 当 且 仅 当 S' 不 可 满足 。 

4) 分 裂 规 则 

若 子 句 集合 S 可 以 写成 如 下 形式 。 

(AVIL)A…A(CA。VL)ACBV mL)A…A(CB,V mL) AR 
其 中 ,A、B,、R 与 L 和 一 无关 , 则 求 出 集合 
S=AA-.…AA.AR 
S:=BA-:…AB.AR 
S 是 不 可 满足 的 , 当 且 仅 当 S, 和 Ss 都 是 不 可 满足 的 。 

运用 Herbrand 定理 并 借助 语义 树 方法 ,从 理论 上 讲 , 可 以 建立 计算 机 程序 实现 自动 
定理 证 明 , 但 实际 中 是 很 难 行 得 通 的 。 

定理 2.24( 归 结 原理 的 完备 性 ) 子 句 集合 S 是 不 可 满足 的 , 当 且 仅 当 存在 使 用 归结 
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推理 规则 由 S 对 空子 句 口 的 演绎 。 

需要 注意 以 下 几 点 。 

(1) 归结 原理 是 半 可 判定 的 , 即 如 果 S 不 是 不 可 满足 的 , 则 使 用 归结 原理 方法 可 能 得 
不 到 任何 结果 。 

(2) 归结 原理 是 建立 在 Herbrand 定理 之 上 的 。 

(3) 如 果 在 子 句 集 S 中 允许 出 现 等 号 或 不 等 号 时 ,归结 法 就 不 完备 了 。 

(4) 归结 方法 是 一 种 可 以 机 械 化 实现 的 方法 , 它 是 Prolog 语言 的 基础 。 











2.4.4 案例 : 一 个 基于 逻辑 的 财务 顾问 


利用 谓词 演算 设计 一 个 简单 的 财务 顾问 。 其 功能 是 帮助 用 户 决 策 是 应 该 向 存款 账户 
中 投资 ,还 是 向 股票 市 场 中 投资 。 一 些 投资 者 可 能 想 把 他 们 的 钱 在 这 两 者 之 间 分 挫 。 推 
荐 给 每 个 投资 个 体 的 投资 策略 依赖 于 他 们 的 收入 和 他 们 已 有 存款 的 数量 , 需 根 据 以 下 标 
准 制定 。 

1) 存款 数额 还 不 充足 的 个 体 始 终 该 把 提高 存款 数额 作为 他 们 的 首选 目标 ,无 论 他 们 


收入 如 何 。 
2) 具有 充足 存款 和 充足 收入 的 个 体 应 该 考虑 风险 较 高 但 潜在 投资 收益 也 更 高 的 股 
票 市 场 。 


3) 收入 较 低 的 已 经 有 充足 存款 的 个 体 可 以 考虑 把 他 们 的 剩余 收入 在 存款 和 股票 间 
分 摊 , 以 便 既 能 提高 存款 数额 ,又 能 尝试 通过 股票 提高 收入 。 

存款 和 收入 的 充足 性 可 以 由 个 体 要 供养 的 人 数 决定 。 设 定 的 标准 是 为 供养 的 每 个 人 
至 少 在 银行 存款 5000 元 。 充 足 的 收入 必须 是 稳定 的 所 得 ,每 年 至 少 补充 15 000 元 ,再 加 
额外 的 给 每 个 要 供养 的 人 4000 元 。 

请 为 一 个 要 供养 3 个人、 有 22 000 元 存款 .25 000 元 稳定 收入 的 投资 者 推荐 投资 
策略 。 

解 : 为 了 自动 化 这 个 咨询 过 程 ,我 们 把 这 些 准则 翻译 成 谓词 演算 语句 。 首 先 考 虑 存 
款 和 收入 的 充足 性 。 用 

savings_account_adequate(X) 

savings_account_ inadequate(X) 

income_adequate(X) 

income_inadequate(X) 
分 别 表示 X 的 存款 充足 、 存 款 不 充足 、X 的 收入 充足 及 收入 不 充足 。 

结论 是 用 二 元 谓词 investment 表示 的 , 它 的 参数 的 可 能 值 是 stocks (股票 )、savings 
(存款 ) 或 combination( 组 合 )( 意 味 应 该 分 摊 投 资 ) 。 

3 条 规则 分 别 表示 如 下 。 

savings_account_ inadequate(X)—>investment(X.savings) 

savings_account_adequate(X) \income_adequate(X)—>investment(X, stocks) 

savings_ account _ adequate (X) 人 income _ inadequate (X) —> investment (X， 


combination) 
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接 下 来 ,这 个 顾问 必须 判断 存款 和 收入 何 时 充足 以 及 何 时 不 充足 。 为 了 计算 充足 存 
款 的 最 小 值 , 定 义 了 函数 minsavings。minsavings 具有 1 个 参数 , 即 要 供养 的 人 数 ,并 且 
返回 该 参数 的 5000 信 。 

利用 minsavings, 存 款 的 充足 性 可 以 由 以 下 规则 判断 。 

VX [amount_saved(X,S) 人 dependents(X,Y) 人 greater(S,minsavings(Y) ) 一 

savings_account_adequate(X)] 

VX [amount_saved(X,S)\ dependents(X,Y) 人 一 greater(S,minsavings( 了 Y) ) 一 

savings_account_inadequate(X)] 
其 中 ,minsavings(Y) 一 5000* Y。 

在 这 些 定义 中 ,amount_saved(X,S) 和 dependents(X,Y) 断 言 投资 者 X 的 当前 存款 
额度 S 和 要 供养 的 人 数 了 ;greater(X, Y) 是 标准 的 算术 公式 ,判断 X 是 否 大 于 YY。 

函数 minincome( 最 低 收 入 ) 定 义 为 : minincome(X) 二 15 000 十 (4000 x XX)。 

当 给 定 要 供养 的 人 数 后 ,使 用 minincome 计算 充足 收入 的 最 小 值 。 投 资 者 的 当前 收 
入 被 表示 为 一 个 谓词 earnings。 因 为 充足 的 收入 必须 既是 稳定 的 ,又 要 超过 最 小 值 ,所 以 
earnings 带 3 个 参数 ,第 一 个 参数 是 投资 者 X, 第 二 个 参数 是 所 得 数额 ,第 三 个 参数 必须 
等 于 steady( 稳 定 ) 或 unsteady( 不 稳定 ) 中 的 一 个 。 这 个 顾问 需要 的 其 他 规则 是 

VX [earnings(X,S, steady) AM dependents(X,Y) A greater(S, minincome(Y))— 
income_adequate(X)] 

VX [earnings(X,S,steady) MN dependents(X,Y)AN 7 greater(S, minincome(Y))—> 
income_inadequate(X) ] 

VX [earnings(X,S,unsteady) 一 income_inadequate(X)] 

为 了 进行 一 次 咨询 ,要 使 用 谓词 amount_saved .earnings 和 dependents 把 一 个 特定 
投资 个 体 的 描述 加 入 到 谓词 演算 的 语句 集合 中 。 于 是 ,一 个 要 供养 3 个 人 、 有 22 000 元 
存款 、25 000 元 稳定 收入 的 投资 者 ( 称 为 wang) 被 描述 为 

amount_saved(wang,22 000) 

earnings(wang,25 000,steady) 

dependents(wang,3) 

这 样 就 得 到 由 以 下 语句 组 成 的 一 个 公式 集合 。 

(1) savings_account_ inadequate(X)—>investment(X,savings) 

(2) savings_account_adequate(X) \income_adequate(X)—>investment(X, stocks) 

(3) savings_account_adequate (X) 人 income _inadequate (X) 一 investment (X, 
combination ) 

(4) YX [amount_saved(X,S) 人 dependents(X,Y) 人 greater(S,minsavings(Y)) 一 

savings_account_adequate(X)] 

(5) VX [amount_saved(X,S) 人 dependents(X,Y) 人 一 greater(S, minsavings(Y))—™> 
savings_account_inadequate(X)] 

(6) VX [earnings(X,S, steady) MN dependents(X,Y) M greater(S, minincome(Y))—> 
income_adequate(X)] 

(7) VX [earnings(X,S, steady) MN dependents(X,Y) 人 一 greater(S，minincome 
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(Y)) 一 income_inadequate(X) ] 

(8) VX [earnings(X,S,unsteady) >income_ inadequate(X)] 

(9) amount_saved(wang,22 000) 

(10) earnings(wang,25 000, steady) 

(11) dependents(wang,3) 
其 中 , minsavings(X) 二 5 000XX, minincome(X) 二 15 000 十 (4 000XX)。 

上 述 公式 描述 了 问题 域 。 利 用 合 一 和 假 言 推理 ,适合 这 个 投资 个 体 (wang) 的 投资 策 
略 可 以 从 这 些 描 述 中 推导 出 来 。 

使 用 蔡 换 {wang/X,25 000/S,3/Y} ,公式 (10) 和 公式 (11) 的 合 取 与 公式 (7) 的 前 提 
的 前 两 个 部 分 合 一 ,得 到 : 

earnings( wang, 25 000, steady) 人 dependents (wang, 3) 人 - greater (25 000， 
minincome(3))—>income_inadequate(wang) 

计 值 函数 minincome 得 到 如 下 表达 式 。 

earnings(wang,25 000, steady) 人 dependents(wang, 3) AM 一 greater(25 000,27 000) 一 
income_inadequate( wang) 

根据 公式 (10) ,公式 (11) 和 greater 的 定义 ,前 提 的 3 个 部 分 均 为 真 ,所 以 整个 前 提 也 
为 真 ,从 而 得 到 结论 income_inadequate(wang)。 这 作为 公式 (12) 加 入 系统 。 

(12) income_inadequate(wang) 

类 似 地 ,把 amount_saved(wang,22 000) 人 dependents(wang,3) 
与 公式 (4) 前 提 的 前 两 项 使 用 替换 (22 000/S, 3/Y} 合 一 ,得 到 : 

amount_saved(wang,22 000) 人 dependents(wang,3) 人 greater(22 000, minsavings 
(3) ) 一 Savings_account_adequate(wang) 

这 里 , 计 值 函数 minsavings(3) 得 到 表达 式 : 

amount_saved(wang,22 000) 人 dependents(wang,3) 人 greater(22 000,15 000) 一 
savings_account_adequate(wang) 

因为 该 蕴涵 式 前 提 的 3 个 部 分 均 为 真 ,所 以 整个 前 提 为 真 ,得 到 savings_account_ 
adequate(wang) ,并 把 它 作 为 公式 (13) 加 入 系统 。 

(13) savings_account_adequate(wang) 

从 公式 (12) 和 公式 (13) ,看 出 公式 (3) 的 前 提 为 真 , 于 是 得 到 结论 investment(wang， 
combination) , 即 给 投资 个 体 wang 的 投资 建议 是 组 合 投 资 。 

思考 : 米 舌 要 供养 4 个 人 ,他 有 30 000 元 的 稳定 收入 ,他 的 存款 账户 中 有 15 000 元 。 
向 上 述 案 例 中 的 通用 投资 顾问 例子 中 加 入 描述 他 的 情况 的 适当 谓词 ,然后 进行 必要 的 合 
一 和 推理 ,以 求 出 提供 给 米 磊 的 投资 建议 。 


2.5 产生 式 系统 


1943 年 ,由 Post 提出 产生 式 系统 (production system) ,使 用 类 似 于 文法 的 规则 ,对 符 
号 串 作 替换 运算 。 用 产生 式 系 统 结 构 求 解 问题 的 过 程 和 人 类 求解 问题 时 的 思维 过 程 很 相 
像 , 因 而 可 以 用 它 模拟 人 类 求解 问题 时 的 思维 过 程 。 目 前 大 多 数 的 专家 系统 都 采用 产生 
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式 系统 的 结构 建造 。 

产生 式 系统 是 AI( 人 工 智 能 ) 系 统 最 常见 的 一 种 结构 ,因此 分 析 产生 式 系统 的 组 成 部 
分 及 其 建立 问题 是 一 个 很 基本 的 问题 。 当 给 定 的 问题 要 用 产生 式 系统 求解 时 ,要 求 能 掌 
握 建 立 产生 式 系统 形式 化 描述 的 方法 ,所 提出 的 描述 体系 应 具有 一 般 性 ,能 推广 应 用 于 这 
一 类 问题 更 复杂 的 情况 。 一 般 化 的 产生 式 系统 可 用 来 描述 许多 重要 人 工 智 能 系统 的 工作 
原理 。 

产生 式 系统 的 综合 数据 库 是 指 对 问题 状态 的 一 种 描述 ,这 种 描述 必须 便于 在 计算 机 
中 实现 ,因此 它 实 际 上 就 是 AI 系统 中 使 用 的 数据 结构 。 

高 效能 的 AI 系统 需要 问题 领域 的 知识 ,通常 可 把 这 些 知 识 细 分 为 3 种 基本 类 别 ; 
加 陈述 性 知识 是 关于 表示 综合 数据 库 的 知识 ,如 待 求解 问题 的 特定 事实 等 ; 四 过 程 性 知 
识 是 关于 表示 规则 部 分 的 知识 ,如 该 领域 中 处 理 陈述 知识 所 使 用 的 规律 性 知识 ; @@ 控 制 
知识 是 关于 表示 控制 策略 方面 的 知识 ,包括 协调 整个 问题 求解 过 程 中 所 使 用 的 各 种 处 理 
方法 ,搜索 策略 ,控制 结构 有 关 的 知识 。 用 产生 式 系统 求解 问题 时 的 主要 任务 就 是 如 何 把 
问题 的 知识 组 织 成 陈述 ,过程 和 控制 这 3 种 组 成 部 分 ,以 便 在 产生 式 系统 中 更 充分 地 得 到 
应 用 。 





2.5.1 产生 式 系统 的 表示 


产生 式 系统 的 基本 要 素 是 ,一 个 综合 数据 库 (globe database) 、 一 组 产生 式 规 则 (set 
of rules) 和 一 个 控制 系统 (control system)。 

综合 数据 库 是 产生 式 系统 所 使 用 的 主要 数据 结构 , 它 用 来 表述 问题 状态 或 有 关 事 实 ， 
即 它 含有 所 求解 问题 的 信息 ,其 中 有 些 部 分 可 以 是 不 变 的 ,有 些 部 分 则 可 能 只 与 当前 问题 
的 解 有 关 。 

人 们 可 以 根据 问题 的 性 质 ,用 适当 的 方法 构造 综合 数据 库 的 信息 。 

产生 式 规 则 的 一 般 形式 为 


ifoethen 


其 中 左 半 部 确定 了 该 规则 可 应 用 的 先决 条 件 , 右 半 部 描述 了 应 用 这 条 规则 所 采取 的 行动 
或 得 出 的 结论 。 一 条 产生 式 规则 满足 了 应 用 的 先决 条 件 之 后 ,就 可 对 综合 数据 库 进 行 操 

如 综合 数据 库 代表 当前 状态 , 则 应 用 规则 后 就 使 状态 发 生 转 换 , 生 成 新 状态 。 

控制 系统 或 策略 是 规则 的 解释 程序 。 它 规定 了 如 何 选 择 一 条 可 应 用 的 规则 对 数据 库 
进行 操作 , 即 决定 了 问题 求解 过 程 的 推理 路 线 。 当 数据 库 满足 结束 条 件 时 ,系统 就 应 停止 
运行 ,还 要 使 系统 在 求解 过 程 中 记 住 应 用 过 的 规则 序列 ,以 便 最 终 能 给 出 解 的 路 径 。 

上 述 产 生 式 系统 的 定义 具有 一 般 性 , 它 可 用 来 模拟 任 一 可 计算 过 程 。 在 研究 人 类 进 
行 问题 求解 过 程 时 ,完全 可 用 一 个 产生 式 系统 模拟 求解 过 程 , 即 可 作为 描述 搜索 的 一 种 有 
效 方法 。 

用 产生 式 系统 求解 这 一 类 问题 时 ,其 基本 过 程 可 描述 如 下 : 


过 程 PRODUCTION 
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DRTR 一 初始 数据 库 
until DATA 满 足 结束 条 件 以 前 ,qo: 
begin 
在 规则 集中 , 选 某 一 条 可 应 用 于 DATA 的 规则 R 
DATA < R 应 用 到 DATA 得 到 的 结果 
end 
这 个 过 程 是 不 确定 的 ,因为 在 第 4 步 没有 明确 规定 如 何 挑选 一 条 合用 的 规则 ,但 用 它 
求解 问题 ,循环 过 程 实际 上 就 是 一 个 搜索 过 程 。 
下 面 通过 九宫 图 游戏 和 M-C 问题 说 明 如 何 用 产生 式 系统 描述 或 表示 求解 的 问题 ,以 
及 用 产生 式 系统 求解 问题 的 基本 思想 。 


ao 由 wb PP 


2.5.2 案例 : 九宫 图 游戏 


在 3X3 组 成 的 九宫 格 棋盘 上 摆 有 8 个 将 牌 ,每 一 个 将 牌 都 刻 有 1 一 8 中 的 某 一 个 数 
码 。 棋 盘 中 留 有 一 个 空格 ,允许 其 周围 的 某 一 个 将 牌 向 空格 移动 。 这 样 ,通过 移动 将 牌 可 
以 不 断 改 变 将 牌 的 布局 。 

这 种 游戏 求解 的 问题 是 ,给 定 一 种 初始 的 将 牌 布局 ( 称 初始 状态 ) 和 一 个 目标 布局 ( 称 
目标 状态 ) , 问 如 何 移动 将 牌 ,实现 从 初始 状态 到 目标 状态 的 转变 。 

问题 的 解答 其 实 就 是 给 出 一 个 合法 的 走 步 序列 。 

要 用 产生 式 系统 求解 这 个 问题 ,首先 必须 建立 起 问题 的 产生 式 系统 描述 , 即 规定 出 综 
合 数 据 库 、 规 则 集合 及 其 控制 策略 。 

设 给 定 的 具体 问题 如 图 2-6 所 示 。 

(1) 综合 数据 库 ， 这 里 要 选择 一 种 数据 结构 表示 将 [#51 一 上 
牌 的 布局 。 通 常 可 用 来 表示 综合 数据 库 的 数据 结构 有 | 7 站 7|8 
符号 串 .向 量 、 集 合 .数组 、 树 .表格 .文件 等 。 对 九 官 图 区 关 ER 
问题 ,选用 二 维 数组 表示 将 牌 的 布局 很 直观 ,因此 该 问 图 2-6 一 个 九宫 图 游戏 实例 
题 的 综合 数据 库 可 用 如 下 形式 表示 。 











人 
































(Sy )， 
其 中 ,1<i wy 和 3,SyE{10,1,…,8}, 且 S; 互 不 相等 ,0 表示 空格 。 

这 样 ,每 一 个 具体 的 矩阵 就 可 表示 一 个 棋局 状态 。 所 有 可 能 的 状态 集合 就 构成 该 问 
题 的 状态 空间 。 

(2) 规则 集合 : 移动 一 块 将 牌 就 使 状态 发 生 转 变 。 改 变 状态 有 4 种 走 法 : 空格 左 移 、 
空格 上 移 、 空 格 右 移 、 空 格 下 移 。 这 4 种 走 法 可 用 4 条 产生 式 规则 模拟 ,应 用 每 条 规则 都 
应 满足 一 定 的 条 件 。 于 是 规则 集 可 表示 如 下 。 

设 5; 记 和 矩阵 第 i 行 第 j 列 的 数码 ,io 、jo 记 空 格 所 在 的 行 、 列 数值 , 即 So 二 0, 则 

if jo—l 之 lthen Soi : 一 Sod-b ,Soa-b : 一 0; 

(Son 向 左 ) 

入 二 2 二 SSO05 

(Sen 向 上 ) 


淄 2 履 ”知识 下 示 和 推理 一 一 


ij 十 1] 委 3 then So : 一 Sodo+b ,Soo+rb : 一 0; 
(CSon 向 右 ) 





ii 十 1 委 3 then Soo : 一 Sao+bp Saorbp: 一 0; 
(Sion 向 下 ) 
(3) 搜索 策略 : 从 规则 集中 选取 规则 并 作用 于 状态 的 一 种 广义 选取 函数 。 确 定 某 一 
种 策略 后 ,以 算法 的 形式 给 出 。 在 建立 产生 式 系统 描述 时 ,还 要 给 出 初始 状态 和 目标 条 
件 , 具 体 说 明 所 求解 的 问题 。 产 生 式 系统 中 控制 策略 的 作用 是 从 初始 状态 出 发 ,寻求 一 个 
满足 一 定 条 件 的 目标 状态 。 对 该 问题 ,初始 状态 和 目标 状态 可 分 别 表示 为 





1 3 
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建立 了 产生 式 系统 描述 之 后 ,通过 控制 策略 可 求 得 实现 目标 的 一 个 走 步 序列 ( 即 规则 
序列 ) ,这 就 是 所 谓 的 问题 的 解 ,如 走 步 序列 ( 右 ` 上 `、 上 \ 右 、 下 .下 ) 就 是 一 个 解 。 这 个 解 序 
列 是 根据 控制 系统 记 住 搜索 目标 过 程 中 用 过 的 所 有 规则 而 构造 出 来 的 。 

一 般 情况 下 ,问题 可 能 有 多 个 解 的 序列 ,但 有 时 会 要 求 得 到 有 某 些 附加 约束 条 件 的 
解 ,例如 要 求 步 数 最 少 , 距 离 最 短 等 。 这 个 约束 条 件 通常 用 代价 (cost) 概 括 ,此 问题 可 叙 
述 为 寻找 具有 最 小 代价 的 解 。 

现在 再 来 看 一 下 人 们 是 如 何 求解 九宫 图 游戏 的 。 

首先 是 仔细 观察 和 分 析 初 始 的 棋局 状态 ,通过 思考 决定 走 法 之 后 ,就 移动 某 一 块 将 
牌 ,从 而 改变 布局 ,与 此 同时 还 能 判定 出 这 个 棋局 是 否 达到 了 目标 。 如 果 尚 未 达到 目标 状 
态 , 则 以 这 个 新 布局 作为 当前 状态 ,重复 上 述 过 程 一 直 进行 下 去 ,直至 到 达 目 标 状态 为 止 。 
可 以 看 出 ,用 产生 式 系统 描述 和 求解 这 个 问题 ,也 是 在 这 个 问题 空间 中 去 搜索 一 条 从 初始 
状态 到 达 目 标 状态 的 路 径 。 这 完全 可 以 模拟 人 们 的 求解 过 程 ,也 就 是 可 以 把 产生 式 系统 
作为 求解 问题 思考 过 程 的 一 种 模拟 。 

关于 该 问题 的 讨论 ,可 参见 参考 文献 [10]。 


2.5.3 案例 : 传教 士 和 野人 问题 


有 N 个 传教 士 (Missionary) 和 N 个 野人 (Cannibal) 来 到 河 边 准备 渡河 ,河岸 有 一 条 
船 ,每 次 至 多 可 供 & 人 乘 渡 。 问 传教 士 为 了 安全 起 见 , 应 如 何 规划 摆渡 方案 ,使 得 任何 时 
刻 河 两 岸 以 及 船上 的 野人 数目 总 不 超过 传教 士 的 数目 , 即 求解 传教 士 和 野人 从 左岸 全 部 
摆渡 到 右岸 的 过 程 中 ,任何 时 刻 满足 M( 传 教士 数 ) 宇 C( 野 人 数 ) 和 MT 十 C 近 & 的 摆渡 
方案 。 

设 N==3,k 二 2, 则 给 定 的 问题 可 用 图 2-7 表示 。 图 中 工 和 尺 表示 左岸 和 右岸 ,B==1 
或 0 分 别 表示 有 船 或 无 船 。 约 束 条 件 是 两 岸上 M 宇 C, 船 上 M 十 C<2。 

(1) 综合 数据 库 , 用 三 元 组 表示 , 即 

(Mi ,CL ,BL), 

其 中 0<Mi ,CL 志 3,BLE10,1})。 


罗 
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L R L R 
mM™|3 0 M |o 3 
el 0 = et 0 3 
B | 1 0 B 0 1 
(a) 初始 状态 (b) 目标 状态 
图 2-7 M-C 问题 实例 
此 时 间 题 描述 简化 为 


(3,3,1) 一 (0,0,0) 
N=3 的 M-C 问题 ,状态 空间 的 总 状态 数 为 4X4X2 三 32, 根 据 约束 条 件 的 要 求 , 可 
以 看 出 只 有 20 个 合法 状态 。 再 进一步 分 析 后 ,又 发 现 有 4 个 合法 状态 实际 上 是 不 可 能 达 
到 的 。 因 此 ,实际 的 问题 空间 仅 由 16 个 状态 构成 。 下 面 列 出 分 析 的 结果 : 


(Mi ,CL ,BL) (Mi ,Ci ,BL) 
(0，0，1) ” 达 不 到 《05 0» 0) 
(0 Ls 好 (0 Ly. 0 
05 -部 : 双 《05 23 的 
tO 35: WD (0，3，0) ” 达 不 到 
(1，0，1) 不 合法 (1，0，0) 不 合法 
1 | ee 
(2 3 (1，2，0) 不 合法 
(1，3，1) 不 合法 (1，3，0) 不 合法 
(2，0，1) 不 合法 (2，0，0) 不 合法 
(2，1，1) 不 合法 (2，1，0) 不 合法 
C34 和 《25 23 0 
(2，3，1) ”不 合法 (2，3，0) 不 合法 
(3，0，1) 达 不 到 C3 0; 0) 
3 a C3; Ly 0) 
[3 二 (3; 2 0) 
Ca. By OD (3，3，0) 达 不 到 


(2) 规则 集合 : 由 摆渡 操作 组 成 。 

该 问题 主要 有 两 种 操作 : 操作 (规定 为 从 左岸 划 向 右岸 ) 和 gq 操作 (规定 为 从 右 
岸 划 向 左岸 ) 。 

每 次 摆渡 操作 ,船上 人 数 有 5 种 组 合 , 因 而 组 成 有 10 条 规则 的 集合 。 


IH(MiL,CL,BL=1) then (M 一 1,Cu,B 一 1); (po 操作) 
IH(MiL,CL,BL=1) then (M,C 一 1,B 一 1D); (pa 操作 ) 
ICML,CL,BL=1) then (Mi 一 1,CL 一 1,BL 一 1); (pu 操作 ) 
IH(MiL ,CL,BL=1) then (Mi.—2,CL,BL—1); (pzo 操 作 ) 
IH(Mi,CL,BL=1) then (Mi,CL—2,B.L—1); (po 操作 ) 


IH(ML,CL,BL=0) then (M 十 1,Cu,BL 十 1); (qu 操作 ) 
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IH(Mi,CL,BL=0) then (ML ,Cr 十 1,BL 十 1); (qu 操作 ) 
HC(Mi ,CL,BL 二 0) then (Mi 十 1,Ci 十 1,BL 十 1); (qu 操作) 
IH(Mi,CL,BL=0) then (Mi+2,CL,BiL+1); (gzo 操 作 ) 
ICM ,CL,BL=0) then (Mi,Ci+2,BL+1); (qos 操作 ) 


(3) 初始 和 目标 状态 , 即 (3,3,1) 和 (0,0,0)。 建 立 了 产生 式 系统 描述 之 后 ,就 可 以 通 
过 控制 策略 对 状态 空间 进行 搜索 , 求 得 一 个 摆渡 操作 序列 ,使 其 能 够 实现 目标 状态 。 

在 讨论 用 产生 式 系统 求解 问题 时 ,有 时 引入 状态 空间 图 的 概念 很 有 帮助 。 状 态 空间 
图 是 一 个 有 向 图 ,其 结 点 可 表示 问题 的 各 种 状态 (综合 数据 库 ) , 结 点 之 间 的 弧 线 代表 一 些 
操作 (产生 式 规 则 ) ,它们 可 把 一 种 状态 导向 另 一 种 状态 。 

这 样 建立 起 来 的 状态 空间 图 描述 了 问题 所 有 可 能 出 现 的 状态 及 状态 和 操作 之 间 的 关 
系 ,因而 可 以 较 直 观 地 看 出 问题 的 解 路 径 及 其 性 质 。 实 际 上 ,只 有 问题 空间 规模 较 小 的 问 
题 才 可 能 做 出 状态 空间 图 ,例如 ,N=3 的 M-C 问题 ,其 状态 空间 图 如 图 2-8 所 示 。 由 于 
每 个 氛 渡 操作 都 有 对 应 的 逆 操 作 , 即 p, 对 应 gw ,所 以 该 图 也 可 表示 成 具有 双向 弧 的 
形式 。 





(3,3,1) 
Pn Po Po 
(2,2.0) (3,2,0) (3,1,0) 
gio gor 


(32,1) 
Yem 
(3,0,0) 
Yo 
(3,1,1) 
VP 
(1,1,0) 
Y90 
(22,1) 
Le 
(0,2,0) 
p90 
(0,3,1) 
YPo 
(0,1,0) 


(0.21) (0,1,1) LD) 
po I 
(0.0.0) 目标 


图 2-8 M-C 问题 状态 空间 图 





从 状态 空间 图 看 出 解 序列 相当 多 ,但 最 短 解 序列 只 有 4 个 , 均 由 11 次 摆渡 操作 构成 。 
若 给 定 其 中 任意 两 个 状态 分 别 作为 初始 和 目标 状态 ,就 可 立即 找 出 对 应 的 解 序 列 。 一 般 
情况 下 ,求解 过 程 就 是 对 状态 空间 搜索 出 一 条 解 路 径 的 过 程 。 

对 问题 表示 的 好 坏 ,往往 对 求解 过 程 的 效率 有 很 大 影响 。 一 种 较 好 的 表示 法 会 简化 
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状态 空间 和 规则 集 表示 ,例如 ,九宫 图 问题 中 ,如 用 将 牌 移动 描述 规则 , 则 8 块 将 牌 就 有 
32 条 的 规则 集 ,显然 用 空格 走 步 描 述 就 简单 得 多 。 

又 如 ,M-C 问题 中 ,用 3X2 的 矩阵 给 出 左 ， 右 岸 的 情况 表示 一 种 状态 当然 可 以 ,但 
显然 仅 用 描述 左岸 的 三 元 组 描述 就 足以 表示 出 整个 情况 ,因此 必须 十 分 重视 选择 较 好 的 
问题 表示 法 。 以 后 的 讨论 还 可 以 看 到 高 效率 的 问题 求解 过 程 与 控制 策略 有 关 , 合 适 的 控 
制 策略 可 缩小 状态 空间 的 搜索 范围 ,提高 求解 的 效率 。 


2.5.4 产生 式 系统 的 控制 策略 


在 2.5.1 节 的 PRODUCTION 过 程 中 ,如 何 选择 一 条 可 应 用 的 规则 ,作用 于 当前 的 
综合 数据 库 , 生 成 新 的 状态 以 及 记 住 选用 的 规则 序列 是 构成 控制 策略 的 主要 内 容 。 

对 大 多 数 的 人 工 智 能 应 用 问题 ,所 拥有 的 控制 策略 知识 或 信息 并 不 足以 使 每 次 通过 
算法 第 4 步 时 ,一 下 子 就 能 选 出 最 合适 的 一 条 规则 ,因而 人 工 智 能 产生 式 系 统 的 运行 就 表 
现 出 一 种 搜索 过 程 ,在 每 一 个 循环 中 选 一 条 规则 试用 ,直至 找到 某 一 个 序列 能 产生 一 个 满 
足 结束 条 件 的 数据 库 为 止 。 

由 此 可 见 ,高 效率 的 控制 策略 需要 有 关 被 求解 问题 的 足够 知识 ,这 样 才能 在 搜索 过 程 
中 减少 盲目 性 ,比较 快 地 找到 解 路 径 。 

控制 策略 可 划分 为 不 可 撤回 方式 和 试探 性 方式 两 大 类 ,其 中 试探 性 方式 又 可 分 为 回 
淹 方 式 和 图 搜索 方式 。 

1. 不 可 撤回 方式 

利用 问题 给 出 的 局 部 知识 决定 如 何 选取 规则 ,根据 当前 可 靠 的 局 部 知识 选 一 条 可 应 
用 规则 并 作用 于 当前 综合 数据 库 。 接 着 再 根据 新 状态 继续 选取 规则 ,搜索 过 程 一 直 进 行 
下 去 ,不 必 考 虑 撤回 用 过 的 规则 。 这 是 由 于 在 搜索 过 程 中 如 能 有 效 利用 局 部 知识 ,即使 使 
用 了 一 条 不 理想 的 规则 ,也 不 妨碍 下 一 步 选 得 男 一 条 更 合适 的 规则 。 这 样 , 不 撤销 用 过 的 
规则 并 不 影响 求 到 解 , 只 是 解 序列 中 可 能 多 了 一 些 不 必要 的 规则 。 

人 们 在 登山 过 程 中 ,目标 是 疏 到 峰 顶 ,问题 就 是 确定 如 何 一 步 一 步 地 朝 着 目标 前 进 达 
到 顶峰 。 其 实 这 就 是 一 个 在 * 疏 山 ?过 程 中 寻求 函数 的 极 大 值 问题 。 

利用 高 度 随 位 置 变化 的 函数 五 (P) 引 导 疏 山 ,就 可 实现 不 可 撤回 的 控制 方式 。 

用 不 可 撤回 的 方式 ( 疏 山 法 ) 求 解 登山 问题 ,只 有 在 登 单 峰 的 山 时 才 总 是 有 效 的 ( 即 对 
单 极 值 的 问题 可 找到 解 )。 对 于 比较 复杂 的 情况 ,如 碰 到 多 峰 、 山 脊 或 平 顶 的 情况 时 , 疏 山 
搜索 法 并 不 总 是 有 效 。 多 峰 时 如 果 初 始点 处 在 非 主峰 的 区 域 , 则 只 能 找到 局 部 优 的 点 上 ， 
即 得 到 一 个 虚假 的 实现 了 目标 的 错觉 。 对 有 山 肴 的 情况 ,如 果 搜 索 方向 与 山 背 的 走向 不 
一 致 ,就 会 停留 在 山 消 处 ,并 以 为 找到 极 值 点 。 当 出 现 大 片 平原 区 把 各 山 包 孤立 起 来 时 ， 
就 会 在 平 项 区 漫 无 边际 地 搜索 ,总 是 试验 不 出 度量 函数 有 变化 的 情况 ,这 导致 随机 盲目 地 
搜索 。 

运用 疏 山 过 程 的 思想 使 产生 式 系 统 具有 不 可 撤回 的 控制 方式 ,首先 要 建立 一 个 描述 
综合 数据 库 变化 的 函数 ,如 果 这 个 函数 具有 单 极 值 . 且 这 个 极 值 对 应 的 状态 就 是 目标 , 则 
不 可 撤回 的 控制 策略 就 是 选择 使 函数 值 发 生 最 大 增长 变化 的 那 条 规则 作用 于 综合 数据 
库 , 如 此 循环 下 去 ,直到 没有 规则 使 函数 值 继续 增长 ,这 时 函数 值 取 最 大 值 ,满足 结束 
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条 件 。 

以 九宫 图 为 例 ,用 “不 在 位 ”将 牌 个 数 并 取 其 负 值 作为 状态 描述 的 函数 一 W(x) (“不 在 
位 ?将 牌 个 数 是 指 当 前 状态 与 目标 状态 对 应 位 置 逐一 比较 后 有 差异 的 将 牌 总 个 数 ,用 
W() 表 示 , 其 中 n 表 示 任 一 状态 )。 用 这 样 定义 的 函数 就 能 计算 出 任 一 状态 的 函数 值 。 
沿 着 状态 变化 路 径 , 可 能 出 现 有 函数 值 不 增加 的 情况 ,这 时 就 要 任 选 一 条 函数 值 不 减 小 的 
规则 来 应 用 ,如 果 不 存 在 这 样 的 规则 , 则 过 程 停止 。 

一 般 来 说 , 仆 山 函数 会 有 多 个 局 部 的 极 大 值 情况 ,这 样 一 来 就 会 破坏 假 山 法 找到 真正 
的 目标 。 例 如 ,初始 状态 和 目标 状态 分 别 如 下 。 




















任意 一 条 可 应 用 于 初始 状态 的 规则 都 会 使 一 WW(n) 下 降 , 这 相当 于 初始 状态 的 描述 函数 值 
处 于 局 部 极 大 值 上 ,搜索 过 程 停止 不 前 , 找 不 到 代表 目标 的 全 局 极 大 值 。 

从 以 上 讨论 可 看 出 对 人 工 智能 感 兴趣 的 一 些 问题 ,使 用 不 可 撤回 的 策略 虽然 不 可 能 
对 任何 状态 总 能 选 得 最 优 的 规则 ,但 是 如 果 应 用 了 一 条 不 合适 的 规则 之 后 ,不 去 撤销 它 并 
不 排除 下 一 步 应 用 一 条 合适 的 规则 ,只 是 解 序列 有 些 多余 的 规则 而 已 , 求 得 的 解 不 是 最 优 
解 ,但 控制 较 简单 。 

此 外 还 应 当 看 到 ,有 时 很 难 对 给 定 问 题 构造 出 任何 情况 下 都 能 通用 的 简单 假山 函数 
( 即 不 具 多 极 值 或 “ 平 顶 ” 等 情况 的 函数 ) ,因而 不 可 撤回 的 方式 具有 一 定 的 局 限 性 。 

1) 回溯 方式 

在 问题 求解 过 程 中 ,有 时 会 发 现 应 用 一 条 不 合适 的 规则 会 阻挠 或 拖延 达到 目标 的 过 
程 。 在 这 种 情况 下 ,需要 有 这 样 的 控制 策略 , 先 试 一 试 某 一 条 规则 ,如 果 以 后 发 现 这 条 规 
则 不 合适 , 则 允许 退回 去 , 另 选 一 条 规则 来 试 。 

对 九宫 图 游戏 ,回溯 应 发 生 在 以 下 3 种 情况 : @ 新 生成 的 状态 在 通 向 初始 状态 的 路 
径 上 已 出 现 过 ; @ 从 初始 状态 开始 ,应 用 的 规则 数目 达到 所 规定 的 数目 之 后 还 未 找到 目 
标 状态 (这 一 组 规则 的 数目 实际 上 就 是 搜索 深度 范围 所 规定 的 ); 加 对 当前 状态 ,再 没有 
可 应 用 的 规则 。 

回溯 过 程 是 一 种 可 试探 的 方法 ,从 形式 上 看 不 论 是 否 存在 对 选择 规则 有 用 的 知识 ,都 
可 以 采用 这 种 策略 。 

即 如 果 没 有 有 用 的 知识 引导 规则 选取 ,那么 规则 可 按 任意 方式 (固定 排序 或 随机 ) 选 
取 , 如 果 有 好 的 选择 规则 的 知识 可 用 ,那么 用 这 种 知识 引导 规则 选取 ,就 会 减少 盲目 性 , 降 
低 回 渊 次数, 甚至 不 回溯 就 能 找到 解 ,总 之 ,一般 来 说 有 利于 提高 效率 。 此 外 ,引入 回溯 机 
理 可 以 避免 陷入 局 部 极 大 值 的 情况 ,继续 寻找 其 他 达到 目标 的 路 径 。 

2) 图 搜索 方式 

如 果 把 问题 求解 过 程 用 图 或 树 的 结构 描述 , 即 图 中 的 每 一 个 结 点 代表 问题 的 状态 , 结 
点 间 的 弧 代 表 应 用 的 规则 ,那么 问题 的 求解 空间 就 可 由 隐 含 图 描述 。 

图 搜索 方式 就 是 用 某 种 策略 选择 应 用 规则 ,并 把 状态 变化 过 程 用 图 结构 记录 下 来 ,一 
直到 得 出 解 为 止 , 也 就 是 从 隐 含 图 中 搜索 出 含有 解 路 径 的 子 图 。 
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2. 试探 性 方式 

这 是 一 种 穷 举 的 方式 ,对 每 一 个 状态 可 应 用 的 所 有 规则 都 要 去 试 , 并 把 结果 记录 下 
来 。 这样, 求 得 一 条 解 路 径 要 搜索 到 较 大 的 求解 空间 。 当 然 ,如 果 利 用 一 些 与 问题 有 关 的 
知识 引导 规则 的 选择 ,有 可 能 搜索 较 罕 的 空间 就 能 找到 解 。 

对 一 个 要 求解 的 具体 问题 ,有 可 能 用 不 同 的 方式 都 能 求 得 解 ,至 于 选用 哪 种 方式 更 适 
宜 ,往往 还 需要 根据 其 他 一 些 实际 要 求 考 虑 决定 。 


2.6 语义 网 络 


语义 网 络 是 J.R. Quillian 1968 年 在 博士 论文 中 作为 人 类 联想 记忆 的 一 个 显 式 心理 
学 模型 最 先 提出 的 。 他 主张 在 处 理 自然 语言 词义 理解 问题 时 ,应 当 把 语义 放 在 第 一 位 ,一 
个 词 的 含义 只 有 根据 它 所 处 的 上 下 文 环境 才能 准确 地 把 握 。 基 于 J. R. Quillian 的 工作 ， 
Simon 于 1970 年 正式 提出 了 语义 网 络 这 个 概念 。 自 20 世纪 70 年 代 中 期 以 来 ,语义 网 络 
已 在 专家 系统 .自然 语言 理解 等 领域 得 到 广泛 应 用 。 


2.6.1 基本 命题 的 语义 网 络 表示 


语义 网 络 形式 上 是 一 个 有 向 图 ,由 一 个 结 点 和 若干 条 弧 线 构成 , 结 点 和 弧 都 可 以 有 标 
号 。 结 点 表示 一 个 问题 领域 中 的 物体 、 概 念 .事件 ,动作 或 状态 , 弧 表 示 结 点 间 的 语义 
联系 。 

在 语义 网 络 知识 表示 中 , 结 点 一 般 划分 为 实例 结 点 和 类 结 点 (概念 结 点 ) 两 种 类 型 。 
如 * 汽 车 这样 的 结 点 是 类 结 点 ,而 * 我 的 汽车 则 是 实例 结 点 。 有 向 弧 用 于 刻画 结 点 之 间 
的 语义 联系 ,是 语义 网 络 组 织 知识 的 关键 。 由 于 语义 联系 非常 丰富 ,不 同 应 用 系统 所 需 的 
语义 联系 和 种 类 及 其 解释 不 尽 相同 。 比 较 典 型 的 语义 联系 有 两 种 。 

1， 以 个 体 为 中 心 组 织 知识 的 语义 联系 

以 个 体 为 中 心 组 织 知识 ,其 结 点 一 般 都 是 名 词性 个 体 或 概念 ,通过 实例 、 泛 化 ,聚集 、 
属性 等 联系 作为 有 向 弧 描述 有 关 结 点 概念 之 间 的 语义 联系 。 

1) 实例 联系 

实例 联系 是 用 于 表示 类 结 点 与 实例 结 点 之 间 的 联系 ,通常 用 ISA 标识 ,如 图 2-9 
所 示 。 

一 个 实例 结 点 可 以 通过 ISA 连接 多 个 类 结 点 ,多 个 实 EFE | 1SA 
例 结 点 也 可 以 通过 ISA 与 一 个 类 结 点 连接 。 

通过 类 结 点 表示 实例 之 间 的 相关 性 ,并 使 同类 实例 结 图 29 实例 联系 举例 
点 的 共同 特征 通过 与 此 相连 的 类 结 点 描述 ,从 而 实现 了 知识 的 共享 。 

2) 泛 化 联系 

泛 化 联系 是 用 于 表示 类 结 点 (如 熊猫 ) 与 抽象 层次 更 高 的 类 结 点 (如 哺乳 动物 ) 之 间 的 
联系 ,通常 用 AKOCA Kind Of 标识。 通过 AKO 可 以 将 不 同 抽象 层次 的 类 结 点 组 织 成 
一 个 AKO 层次 网 络 ,如 图 2-10 所 示 。 

泛 化 联系 允许 低层 类 结 点 继承 高 层 类 结 点 的 属性 ,因而 一 些 共同 的 属性 不 必 在 每 个 
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低层 类 结 点 中 重复 。 
动物 
t 
哺乳 动物 鸟 类 动物 
下 
AKO [AKO [AKO |AKO AKO |AKO |AKO 
熊猫 狗 猪 大 象 鸽子 燕子 | | 麻雀 
图 2-10 泛 化 联系 举例 
3) 聚集 联系 


聚集 联系 是 用 于 表示 与 其 组 成 成 分 之 间 的 联系 ,通常 用 Part-of 表示 ,如 图 2-11 
所 示 。 

4) 属性 联系 

属性 联系 是 用 于 表示 个 体 、 属 性 及 其 取 值 之 间 的 联系 。 通 常用 有 向 弧 表 示 属 性 ,用 弧 
所 指向 的 结 点 表示 属性 的 值 ,如 图 2-12 所 示 。 


贺 珠 和 



























































Part-of Part-of [性别 年 齿 身高 职业 
笔 世 笔杆 男 30 175m 教师 
图 2-11 聚集 联系 举例 图 2-12 属性 联系 举例 


图 2-13 是 描述 桌子 的 语义 网 络 , 其 中 包含 了 上 述 实例 , 泛 化 .聚集 和 属性 4 种 联系 。 
由 图 2-13 可 见 ,以 个 体 为 中 心 组 织 知识 ,其 结 点 一 般 都 是 各 词性 个 体 或 概念 ,其 间 的 语义 
联系 通过 ISA、AKO、Part-of 以 及 属性 标识 的 有 向 弧 实 现 。 


ISA AKO 
饭桌 梨子 | 一 | 家 只 


Part-of 了 Part-of 


ET 桌面 
要 | | | 
4 棕 时 | [方形 

2-13 “描述 桌子 的 语义 网 络 

























































































2. 以 谓词 或 关系 为 中 心 组 织 知识 的 语义 联系 

设 有 nn 元 谓词 或 关系 R(argl,arg2,…,argn), 分 别 取 
值 为 al,a2,…,an, 其 对 应 的 语义 网 络 可 表示 为 图 2-14 的 | _al BE a 
形式 。 

为 了 表示 “有 一 张 木头 做 的 方 桌 ”这 一 知识 可 用 以 个 体 人 
为 中 心 组 织 知识 的 语义 网 络 表示 ,如 图 2-15(a) 所 示 。 图 ”图 2-14 关系 语义 网 络 表示 
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中 ,Comp 表示 材料 属性 ,Form 表示 形状 属性 。 也 可 用 以 谓词 为 中 心 组 织 知 识 的 语义 网 
络 表 示 , 如 图 2-15(b) 所 示 。 图 中 ,Comp( 桌 子 , 木 头 ) 表 示 “ 桌 子 的 材料 是 木头 ”这 一 谓 
词 ;Form( 桌 子 , 方 形 ) 表 示 “ 桌 子 的 形状 是 方形 的 ”这 一 谓词 。 





Form Comp 
























































[六 上 桌子 | 林 基 
人 语义 网 络 一 

方形 木头 

Form + Comp 
(b) 语义 网 络 二 


图 2-15 “有 一 张 木头 做 的 方 桌 ”的 语义 网 络 


与 个 体 结 点 一 样 ,关系 结 点 同样 可 以 划分 为 类 结 点 和 实例 结 点 两 种 。 实 例 关 系 结 点 
与 类 关系 结 点 之 间 用 ISA 标识 ,如 图 2-16 所 示 。 图 中 把 动作 give 看 作 一 个 三 元 关系 ,其 
属性 分 别 为 给 予 者 (giver) ,接收 者 (recipient) 和 被 给 的 物体 (object) 。giver 为 实例 关系 
结 点 ,give 为 类 关系 结 点 。 









































































































































| 1 
”| Person thing ISA 
hisa 人 sa 
Personl thingl person2 
4 Fobiect t 
Biver 和 Recipient 
give 
ISA iver t ISA i 
gl givel Recipient ISA 
1 | Object 1 
John War and peace Mary 
1 ISA 
AKO 
book 








图 2-16 关系 语义 网 络 举例 


2.6.2 连接 词 在 语义 网 络 中 的 表示 


1. 合 取 

由 于 语义 网 络 从 本 质 上 讲 , 只 能 表示 二 元 关系 ,因此 当 要 用 它 表 示 多 元 关系 时 ,就 把 
多 元 关系 转化 为 二 元 关系 的 合 取 。 例 如 ,图 2-17 给 出 了 John gives Mary a book. 的 语义 
网 络 表示 。 图 中 , 结 点 为 与? 结 点 ,与 G 结 点 相连 的 Giver、Recipient 及 Object 3 个 连接 
构成 合 取 关系 。 
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Give 
I 
ISA 
John [= G -| Mary 
Giver Recipient 
Object 
1 
Book 





图 2-17 合 取 的 语义 网 络 表示 


2. 析 取 
在 语义 网 络 中 ,如 果 不 加 标志 ,就 表示 连接 之 间 的 关系 是 合 取 关系 ,而 对 析 取 、 否 定 和 
蕴涵 关系 ,都 加 有 标志 。 在 连接 上 加 注 DIS 析 取 界限 表示 析 取 关系 。 例 如 ,要 表示 
ISA(A,B)V Part-of(B,C) 
其 语义 网 络 如 图 2-18 所 示 。 如 果 不 加 注 析 取 界限 , 则 此 网 络 就 可 能 误解 为 
ISA(A,B) A Part-of(B,C) 
3. 否定 
在 语义 网 络 中 ,否定 的 表示 有 两 种 。 对 单个 关系 的 否定 可 在 弧 的 标记 前 加 上 否定 符 
号 ,如 ”(ISACA,B)) 可 表示 为 图 2-19(a)。 表 示 多 个 关系 的 合 取 或 析 取 的 否定 时 ,可 
采用 NEG 界限 标注 ,如 图 2-19(b) 所 示 。 


i 
1 对 
1 
1 
ISA 
fh peo = 
B 


DIS (a) 单个 关系 (b) 多 个 关系 
图 2-18 析 取 的 语义 网 络 表示 图 2-19 否定 的 语义 网 络 表示 

































































4. 蕴涵 

在 语义 网 络 中 ,用 标注 ANT(antectedent) 和 CONSE(consequence) 界 限 分 别 表 示 蕴 
涵 前 件 和 蕴涵 后 件 。 例 如 : 

Every one who lives at 37 Maple Street is a programmer. 
可 用 语义 网 络 表示 为 图 2-20。 图 中 ,在 前 件 部 分 用 Y 结 点 表示 地 址 ,X 结 点 是 一 个 变量 ， 
表示 与 立 事件 有 关 的 人 ;在 后 件 部 分 建立 了 一 个 表示 职业 的 结 点 。 一 个 特定 的 职业 是 X 
和 Y 的 函数 ,没有 必要 以 新 的 变量 标识 。 图 中 的 虚线 框 分 别 标注 出 与 前 后 件 有 关 的 弧 ， 
并 用 虚线 把 两 个 界限 连接 起 来 ,以 表示 蕴涵 关系 。 
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图 2-20 蕴涵 的 语义 网 络 表示 


2.6.3 语义 网 络 的 推理 


目前 ,大 多 数 语义 网 络 采用 的 推理 机 制 主要 有 两 种 , 即 匹配 和 继承 。 

1. 匹配 

在 语义 网 络 中 ,事物 是 通过 语义 网 络 这 种 结构 描述 的 ,事物 的 匹配 则 为 结构 上 的 匹 
配 ,包括 结 点 和 弧 的 匹配 。 用 匹配 的 方法 进行 推理 时 ,首先 构造 问题 的 目标 网 络 块 ,然后 
在 事实 网 络 中 寻找 匹配 。 推 理 从 一 条 弧 连 接 的 两 个 结 点 的 匹配 开始 ,再 匹配 与 这 两 个 结 
点 相连 接 的 所 有 其 他 结 点 ,直到 问题 得 到 解答 。 这 种 方法 的 例子 如 图 2-21 所 示 , 其 中 
图 2-21(a) 为 事实 网 络 ,图 2-21(b) 为 目标 网 络 。 



























































Clyde | ISA -| Robin | ISA -| Bird Clyde 

下 

Owner Owner 

Own? ? 

Ownl Owns | Nestl TSA = Nest wn owns ~ ? 

ISA I* 

! ISA 
Owership 六 一 一 一 Situation Owership 

(a) 事实 网 络 (b) 目标 网 络 


图 2-21 网 络 的 匹配 过 程 


图 2-21(b) 表 示 这 样 一 个 问题 : 

What does Clyde own? 

用 图 2-21(b) 这 个 目标 网 络 去 匹配 事实 网 络 图 2-21(a) ,寻找 一 个 有 一 条 Owner 弧 指 
向 Clyde 的 Own 结 点 。 当 找到 这 样 的 结 点 时 .Owner 弧 指 向 的 结 点 即 为 上 述 问题 的 答案 
(Nest1) ,否则 答案 将 是 : 

Clyde doesn't own anything. 

当 事 实 网 络 较 大 或 较 复杂 时 ,在 匹配 算法 中 可 加 入 一 些 含有 启发 式 知 识 的 选择 器 函 
数 ,以 提供 事实 网 络 中 哪些 结 点 和 弧 可 以 优先 考虑 匹配 和 怎样 匹配 的 建议 。 这 种 选择 器 
函数 能 加 速 匹配 的 搜索 过 程 。 
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2. 继承 

在 语义 网 络 中 ,所 谓 继 承 是 把 对 事物 的 描述 从 概念 结 点 或 类 结 点 传送 到 实例 结 点 。 
这 种 推理 过 程 类 似 于 人 的 思维 过 程 。 一 旦 知道 了 某 种 事物 的 身份 , 便 可 联想 起 很 多 兰 
这 件 事物 的 一 般 描 述 。 语 义 网 络 的 继承 推理 方式 有 3 种 : 值 继承 “默认 ”继承 和 “附加 过 

1) 值 继 承 

以 图 2-22 为 例 , 说 明 怎 样 使 用 值 继 承 推理 求 出 Brickl 的 形状 。 作 为 问题 的 给 定 结 点 
Brickl 和 弧 Shape( 形 状 ) ,从 Brickl 结 点 出 发 ,检查 是 否 有 以 其 为 出 发 点 的 Shape 弧 。 如 
果 有 , 则 Shape 指向 结 点 的 值 即 为 解 ;否则 依次 检查 与 Brickl 相连 的 ISA 弧 指 向 的 结 点 ， 
如 果 有 从 这 些 结 点 出 发 的 Shape 弧 , 则 找到 解 。 图 中 有 与 Brick 结 点 相连 的 Shape 弧 , 它 
指向 结 点 Rectangular, 即 得 到 Brickl 的 形状 为 Rectangular( 和 矩形 ) 的 解 。 如 果 从 所 有 通 
过 ISA 弧 与 Brickl 相连 的 这 些 结 点 上 都 没有 出 发 的 Shape 弧 , 则 开始 查找 AKO 链 指向 
的 结 点 ,看 是 否 有 Shape 弧 从 那里 出 发 。 如 此 搜索 下 去 ,如 果 直 到 最 后 都 找 不 到 Shape 
弧 , 则 宣布 搜索 失败 。 

2)“ 上 默认 ”继承 

某 些 情况 下 ,在 对 事物 所 做 的 假设 不 是 十 分 有 把 握 时 ,最 好 对 假设 加 上 “可 能 "这样 的 
词 。 例 如 ,头痛 可 能 是 感冒 ,但 不 能 肯定 。 把 这 种 具有 相当 程度 的 真实 性 但 有 不 能 十 分 肯 
定 的 值 称 为 默认” 值 。 表 示 该 结 点 的 值 为 “默认 ” 值 的 方法 ,是 在 指向 该 结 点 的 弧 的 标注 
下 加 上 DEFAULT 标记。 图 2-23 所 示 网 络 的 含义 是 ,从 整体 来 说 ,Block 的 颜色 可 能 是 
Blue, 而 Brick 的 颜色 可 能 是 Red。 

“上 默认 ”继承 的 推理 过 程 类 似 于 值 继承 ,不 过 搜索 的 是 给 定 弧 标注 下 带 有 Default 标 
记 的 弧 。 
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oo——— Bo Color 
Block ock  [——————”| ue 
(Defaul 
AKO 
pe Color 
Brick? | | Rectangular [Bric 上 2 一 一 Red 
(Default) 
ISA 
Brickl Brickl 
图 2-22 语义 网 络 的 值 继 承 图 2-23 语义 网 络 的 “默认 ”继承 


3)“ 附 加 过 程 ?继承 

在 某 些 情况 下 ,对 事物 的 描述 不 能 直接 从 概念 结 点 或 类 结 点 继承 而 得 ,但 可 以 利用 已 
知 的 信息 计算 。 例 如 ,可 以 根据 体积 和 密度 计算 积木 的 重量 。 进 行 上 述 计算 的 程序 称 为 
if-needed 程序 ,存放 在 带 有 IF-NEEDED 附加 标记 的 弧 指 向 的 结 点 中 。 如 图 2-24(a) 所 
示 ,一 个 计算 重量 的 程序 存放 在 连接 Block 结 点 的 Weight 弧 (下 加 IF-NEEDED 标记 ) 指 
向 的 结 点 中 。 

“附加 过 程 ? 继 承 推理 的 过 程 类 似 于 值 继 承 过 程 。 如 图 2-24(b) 所 示 , 为 了 得 到 
Brick1l 的 重量 ,搜索 下 加 IF-NEEDED 标记 的 Weight 弧 ,执行 if-needed 程序 ,然后 在 
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Brickl 结 点 上 添加 Weight 弧 ,并 把 if-needed 程序 的 执行 结果 ( 即 重量 ), 填 入 Weight 弧 
指向 的 结 点 。 


















































I Block-Weight 
IF-NEEDED Procedure 
AKO Weight 
4400 
二 [so ] 
Brickl Volume 400 
ISA Voume 一 400 ric 
Brickl PR 
Density 11 Density [Lu | 











(a) (b) 
图 2-24 语义 网 络 的 “附加 过 程 " 继 承 


2.6.4 语义 网 络 表示 的 特点 


由 结 点 和 弧 组 成 的 语义 网 络 表达 直观 .自然 ,易于 理解 ,其 继承 推理 方式 符合 人 类 的 
思维 习惯 。 语 义 网 络 把 事物 的 结构 、 属 性 及 事物 间 的 联系 显 式 地 表达 出 来 ,与 一 个 事物 相 
关 的 事实 、 特 征 、 关 系 可 以 通过 相应 结 点 的 弧 推 导出 来 。 基 于 语义 网 络 表达 的 系统 便于 以 
联想 方式 实现 系统 的 解释 。 

但 语义 网 络 表示 法 试图 用 结 点 代表 世界 上 的 各 种 事物 ,用 弧 代表 事物 间 的 任何 联系 ， 
其 形式 过 于 简单 。 如 果 结 点 间 的 联系 只 局 限于 几 种 典型 的 关系 , 则 难以 表达 较 复 杂 的 关 
系 ;而 增加 联系 又 会 大 大 增加 网 络 的 复杂 度 ,相应 的 知识 存储 和 检索 过 程 就 会 变 得 十 分 复 
杂 。 事 实 上 ,语义 网 络 的 管理 和 维护 也 是 很 复杂 的 。 


2.7 框架 


在 人 类 日 常 的 思维 和 求解 问题 活动 中 , 当 分 析 和 解释 新 的 情况 时 ,常常 使 用 从 过 去 的 
经 验 中 积累 起 来 的 知识 。 这 些 知识 规模 巨大 而 且 以 很 好 的 组 织 形式 存储 在 人 类 的 记忆 
中 。 由 于 过 去 的 经 验 是 由 无 数 个 具体 事例 、 事 件 组 成 的 ,人 们 无 法 把 所 有 事例 、 事 件 的 细 
节 都 一 一 存储 在 大 脑 中 ,而 只 能 以 一 个 通用 的 数据 结构 形式 存储 。 这样 的 数据 结构 称 为 
框架 。 对 一 个 特定 的 事物 ,只 要 把 它 的 特征 数据 填 人 框架 ,该 框架 就 表示 了 该 事物 。 同 
时 ,可 以 根据 以 往 的 经 验 获得 的 概念 对 这 些 数 据 进行 分 析 和 解释 ,还 可 以 寻找 与 该 事物 有 
关 的 统计 信息 。 


2.7.1 框架 的 构成 


一 个 框架 (frame) 由 框架 名 和 一 组 用 于 描述 框架 各 方面 具体 属性 的 槽 (slot) 组 成 。 
每 个 槽 设 有 一 个 槽 名 , 它 的 值 描述 框架 所 表示 的 事物 的 各 组 成 部 分 的 属性 。 在 较 复 杂 的 
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框架 中 , 槽 下 面 还 可 进一步 区 分 为 多 个 侧面 (facet) ,每 个 侧面 又 有 一 个 或 多 个 侧面 值 ,每 
个 侧面 值 又 可 以 是 一 个 值 或 是 一 个 概念 的 陈述 。 
框架 的 结构 可 以 抽象 地 表示 如 下 。 


< 框架 名 > 
< 槽 名 1> < 侧面 值 11>< 值 111>… 
< 侧面 值 12>< 值 121>… 


< 侧面 值 Im>< 值 Iml>… 


< 槽 名 n> < 侧面 值 n1>< 值 n11>… 
< 侧面 值 n2>< 值 n21>… 


< 侧面 值 nm>< 值 nnl>… 


图 2-25 所 示 是 一 个 描述 椅子 概念 的 简单 框架 的 例子 。 该 框架 含有 4 个 槽 : 物体 的 范 
畴 (建立 物体 间 的 属性 继承 关系 )、 椅 子 腿 的 数目 、 靠 背 式样 和 模 值 。 





CHAIR Frame JOHN'S-CHAIR Frame 
Specialization-of:FURNITURE Specialization-of:CHRAIR 
Number-of-Legs:an integer (DEFAULT 4) Number-of-Legs:4 
Style-of-Back: Straight, Cushioned Style-of-Back:Cushioned 
Number-of-Arms:0,1 or 2 Number-of-Arms:0 

















(a) (b) 
2-25 ”椅子 概念 的 简单 框架 


下 面 的 示例 是 关于 饭店 的 一 个 框架 结构 。 


Generic RESTAURANT Frame 
Specialization- of:Business- Establishment 
Types: 
range: (Cafeteria,Seat- Yourself,Wait- To- Be- Seated) 
default: Wait- To- Be- Seated 
if-need: IF plastic- orange- counter THEN Cafeteria 
IE wait- for- Waitress- sign OR reservations-made 
THEN wait- To- Be- Seated 
OTHERWISE Seat- Yourself 
Location: 
range: an ADDRESS 
if- needed: (Look at the MENU) 
Name: 
if- needed: (Look at the MENU) 
Food- Style: 
Range: (Burgers, Chinese, American, Seafood, French) 
default :American 
if- needed: (Update Alternative of Restaurant) 


Times- of- Operation: 


ol 
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Range:a Time- of- Day 
default :open evenings except Mondays 
Payment- Form: 
Range: (Cash, Credit- Card, Check) 
Alternatives: 
Range: (all Restaurants with same Food- Style) 
if- needed: (Find all Restaurants with the same Food- Style) 


由 上 述 两 个 例子 可 见 ,在 框架 知识 表示 中 ,除了 表示 框架 各 种 属性 的 槽 或 侧面 ,还 经 
常 使 用 默认 (DEFAULT) 值 侧面 和 附加 过 程 (IF-NEEDED) 侧 面 。 

一 个 槽 的 默认 侧面 为 槽 的 属性 值 提供 了 一 个 隐 含 值 。 如 椅子 的 腿 通 常 为 4 条 ,如 果 
一 个 实际 问题 的 上 下 文 没有 提供 相反 的 证 据 , 则 认为 隐 含 值 是 正确 的 。 

一 个 槽 的 附加 过 程 侧面 包含 一 个 附加 过 程 ,在 上 下 文 和 默认 侧面 都 没有 给 出 需要 的 
属性 值 时 ,附加 过 程 给 出 槽 值 的 计算 过 程 或 填 槽 时 要 做 的 动作 ,通常 对 应 于 一 组 子 程序 。 
在 关于 饭店 的 框架 中 ,其 Types,Location,Name,Food-Style 和 Alternatives 各 槽 都 有 附 
加 过 程 侧面 。 正 是 这 种 附加 过 程 ,把 过 程 性 知识 有 机 地 结合 到 框架 的 表示 中 。 

综 上 所 述 ,在 框架 系统 中 ,每 个 侧面 有 4 种 填写 方式 : 四 靠 已 知 的 情况 或 物体 属性 提 
供 ; @ 通 过 默认 隐 含 ; 四 通过 调用 框架 的 继承 关系 实现 属性 值 继承 ; @ 对 附加 过 程 侧面 
通过 执行 附加 过 程 实现 。 

在 框架 系统 的 框架 之 间 , 除 有 继承 关系 外 ,还 可 能 具有 肉 套 关系 。 如 程序 中 的 
Location 槽 是 关于 地 址 的 描述 ,这 样 的 “地 址 ?概念 本 身 有 可 能 是 另 一 个 框架 结构 ,从 而 形 
成 了 框架 的 嵌 套 。 


2.7.2 框架 系统 的 推理 


对 一 个 给 定 的 问题 ,框架 推理 主要 完成 两 种 推理 活动 : 一 是 匹配 , 即 根据 已 知事 实 寻 
找 合适 的 候选 框架 ;二 是 填 槽 , 即 填写 候选 框架 中 的 未 知 槽 值 ,从 而 寻找 出 未 被 给 出 或 尚 
未 发 现 的 事实 。 

1. 匹配 

当 利用 由 框架 构成 的 知识 库 进 行 推理 ,形成 概念 和 做 出 决策 时 ,其 过 程 往往 是 根据 已 
知 的 信息 ,通过 与 知识 库 中 预先 存储 的 框架 进行 匹配 , 即 逐 槽 比较 ,从 中 找 出 一 个 或 几 个 
与 该 信息 提供 的 情况 最 适合 的 候选 框架 ,然后 再 对 所 有 候选 框架 进行 评估 ,以 决定 最 合适 
的 预选 框架 。 这 些 评估 准则 通常 很 简单 ,如 以 某 个 或 某 些 重要 属性 是 否 存 在 , 某 属性 值 是 
否 属于 允许 的 误差 范围 等 为 条 件 判 定 匹 配 是 否 成 立 。 较 复杂 的 评估 准则 可 以 是 一 组 产生 
式 规则 或 过 程 , 用 来 推导 匹配 是 否 成 功 。 在 实际 构造 框架 系统 时 ,可 以 根据 特定 应 用 领域 
的 要 求 定义 合适 的 判定 原则 。 

如 果 当 前 候选 框架 匹配 失败 ,就 需要 选择 其 他 的 候选 框架 。 从 失败 的 候选 框架 中 有 
可 能 得 到 下 一 个 应 选 框架 的 一 些 线索 ,这 种 线索 使 得 控制 转换 到 另 一 个 更 有 可 能 的 候选 
框架 中 ,从 而 不 必 放 弃 以 前 的 全 部 工作 而 一 切 从 头 开始 。 为 此 ,有 以 下 几 种 方法 可 以 
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(1) 找 出 当前 候选 框架 中 已 经 匹配 成 功 的 框架 片段 ,把 这 个 框架 片段 同 其 他 在 同一 
层次 上 的 可 能 候选 框架 进行 片段 匹配 。 如 果 匹 配 成 功 , 则 当前 候选 框架 中 的 许多 属性 值 
可 以 填 入 新 的 候选 框架 。 

(2) 在 框架 中 建立 另 一 个 专门 的 槽 ,这 类 槽 中 存放 一 些 本 框架 匹配 不 成 功 时 应 转向 
哪个 方向 进行 试探 的 建议 ,这 些 建议 能 使 系统 的 控制 转移 到 另外 的 框架 上 去 。 例 如 ,在 图 
2-25(a) 中 ,可 以 建立 一 个 MOVE 槽 , 存 人 “如 果 没 有 靠背 并 且 太 宽 , 则 建议 用 BENCH 
(长 更) 框架 ;如 果 太 高 并 且 没有 靠背 , 则 建议 用 STOOL( 莫 子 ) 框 架 ”。 

(3) 沿 着 框架 系统 排列 的 层次 向 上 回溯 。 如 从 狗 框架 一 哺乳 动物 框架 一 动物 框架 ， 
直到 找到 一 个 足够 通用 , 且 与 已 知 信息 不 矛盾 的 框架 。 

2. 填 槽 

推理 过 程 中 填 槽 的 方式 有 4 种 : 查询、 默认 ,继承 和 附加 过 程 计算 。 其 中 查询 方式 是 
指使 用 系统 先前 推理 中 得 出 的 , 仍 得 留 在 当前 数据 库 中 的 中 间 结 果 或 者 由 系统 之 外 的 用 
户 输入 到 当前 数据 库 的 数据 。 默 认 和 继承 方式 是 相对 简单 的 填 槽 方式 ,因为 它们 不 需要 
系统 做 过 多 的 推理 ,这 种 特性 是 框架 表示 有 效 性 的 一 个 重要 方面 。 它 使 得 框架 推理 可 以 
使 用 根据 以 往 经 验 得 到 的 属性 值 ,而 无 须 重新 计算 。 附 加 过 程 计 算 的 推理 方式 使 得 框架 
系统 的 问题 求解 通过 特定 领域 的 知识 而 提高 了 求解 效率 。 


2.7.3 框架 表示 的 特点 


框架 是 一 种 经 过 组 织 的 结构 化 知识 表示 方法 。 每 个 框架 形成 一 个 独立 的 知识 单元 ， 
其 上 的 操作 相对 独立 ,从 而 使 框架 表示 有 较 好 的 模块 性 ,便于 扩充 。 框 架 表示 对 知识 的 描 
述 模 拟 了 人 脑 对 事物 的 多 方面 多 层次 的 存储 结构 ,直观 自然 ,易于 理解 , 且 充 分 反映 事物 
间 内 在 的 联系 。 框 架 表 示 中 的 附加 过 程 侧面 使 框架 不 但 能 描述 静态 知识 ,而 且 还 能 反映 
过 程 性 知识 ,把 两 者 有 机 地 融合 在 一 起 ,形成 一 个 整体 系统 。 

框架 表示 的 不 足 在 于 框架 结构 本 身 还 没有 形成 完整 的 理论 体系 ,框架 、 模 和 侧面 等 各 
知识 表示 单元 缺乏 清晰 的 语义 ,其 表达 知识 的 能 力 尚 待 增强 ,支持 其 应 用 的 工具 尚 待 开 
发 。 此 外 ,在 多 重 继承 时 有 可 能 产生 多 义 性 ,如 何 解决 继承 过 程 中 概念 属性 的 歧义 ,目前 
尚 没有 统一 的 方法 。 

因而 ,框架 系统 适合 于 表示 典型 的 概念 ,事件 和 行为 。 在 一 些 大 型 的 系统 中 ,框架 表 
示 的 使 用 总 是 与 其 他 模式 (如 产生 式 系统 ) 有 机 地 结合 在 一 起 。 


2.8 脚本 


自然 语言 理解 程序 即使 要 理解 非常 简单 的 会 话 ,也 需要 使 用 非常 大 量 的 背景 知识 。 
有 证 据 表明 人 类 是 把 知识 组 织 成 与 各 种 典型 情况 相对 应 的 结构 。 如 果 在 阅读 一 篇 关于 饭 
店 、 篮 球 或 者 警 探 的 故事 ,那么 我 们 会 以 一 种 和 饭店 、 篮 球 或 警 探 一 致 的 方式 解决 文中 的 
二 义 性 。 如 果 故 事 的 主题 发 生 了 意 想 不 到 的 改变 ,那么 有 证 据 表 明 阅 读 会 发 生 短暂 的 停 
顿 ,这 被 认为 是 在 改变 知识 结构 。 一 篇 组 织 或 者 结构 很 差 的 故事 是 很 难 被 人 理解 的 ,这 可 
能 就 是 因为 我 们 不 能 很 容易 地 把 它 和 现 有 的 任何 知识 结构 拟 合 起 来 。 当 对 话 的 主题 突然 
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改变 时 ,也 可 能 存在 理解 上 的 错误 ,这 是 因为 我 们 混淆 了 解决 对 话 中 的 代词 所 指 或 其 他 歧 
义 应 该 使 用 的 上 下 文 。 


2.8.1 脚本 概念 


脚本 (script) 是 一 种 结构 化 的 表示 ,用 来 描述 特定 上 下 文中 固定 不 变 的 事件 序列 。 脚 
本 最 先是 由 Schank 和 他 的 研究 小 组 设计 的 ,用 来 作为 一 种 把 概念 依赖 结构 组 织 为 典型 
情况 描述 的 手段 。 自 然 语言 理解 系统 使 用 脚本 根据 系统 要 理解 的 情况 组 织 知 识 库 。 

大 多 数 成 年 人 在 饭店 中 都 不 会 感到 任何 不 自在 (因为 ,作为 顾客 ,他 们 知道 想 要 什么 
以 及 如 何 去 做 )。 他 们 在 饭店 入 口 处 被 接待 ,或 者 通过 标志 继续 向 前 找到 桌子 。 如 果菜 单 
没 在 桌 上 ,服务 员 也 没有 送 过 来 ,那么 顾客 会 向 服务 员 要 菜单 。 也 就 是 说 ,顾客 理解 整个 
流程 : 点 菜 、 食 用 、 付 账 ,然后 离开 。 

事实 上 ,饭店 脚本 和 其 他 的 进餐 脚本 大 不 相同 ,如 “快餐 "模式 或 者 “正规 的 家 庭 餐 ”。 
在 快餐 模式 中 ,顾客 进来 .排队 等 待 点 单 、 付 款 (在 食用 之 前 )、 等 待 装 有 所 点 食品 的 餐 盘 、 
接 过 和 餐 盘 并 找 一 张 干净 的 桌子 ,等 等 。 这 是 两 个 不 同 的 套路 化 的 事件 序列 ,每 个 都 有 一 个 
潜在 的 脚本 。 

脚本 由 以 下 5 部 分 组 成 。 

(1) 进入 条 件 (entry condition) : 也 就 是 要 调用 这 个 脚本 必须 满足 的 世界 描述 。 在 前 
面 的 示例 脚本 中 ,进入 条 件 包括 一 家 营业 的 饭店 和 一 个 有 钱 的 饥饿 顾客 。 

(2) 结果 (result) : 也 就 是 脚本 一 旦 终止 就 成 立 的 事实 。 例 如 ,顾客 吃 饱 了 的 同时 钱 
变 少 了 ,饭店 老板 的 钱 增多 了 。 

(3) 道具 (prop): 也 就 是 支持 脚本 内 容 的 各 种 “东西 "。 它 可 能 包括 桌子 、 服 务 员 以 
及 菜单 。 道 具 集合 支持 合理 的 默认 假定 : 假定 饭店 拥有 桌子 和 椅子 ,除非 特别 说 明 。 

(4) 角色 (role) 任 务 : 也 就 是 各 个 参与 者 所 执行 的 动作 。 服 务 员 拿 菜 单 、 上 菜 以 及 拿 
账单 。 顾 客 点 菜 、 食 用 以 及 付 账 。 

(5) 场次 (scene) : Schank 把 脚本 分 解 成 一 系列 场次 ,每 一 场次 呈现 一 段 脚 本 。 在 饭 
店 中 有 进入 、 点 菜 、 食 用 等 场次 。 

脚本 的 要 素 语义 含义 的 基本 “片段 ”一 一 是 用 概念 依赖 关系 表示 的 。 这 些 要 素 放 
入 一 种 类 似 框架 的 结构 ,它们 代表 了 一 个 含义 序列 ,也 就 是 一 个 事件 序列 。 





2.8.2 案例 : 饭店 脚本 


图 2-26 给 出 了 一 个 特定 的 饭店 脚本 。 

当 程序 读 一 小 段 关 于 饭店 的 故事 时 , 它 可 以 把 故事 解析 为 内 部 的 概念 依赖 表示 。 因 
为 这 种 内 部 描述 中 的 关键 概念 符合 这 段 脚本 的 进入 条 件 , 所 以 这 个 程序 就 把 故事 中 提 到 
的 人 和 事 绑 定 到 脚本 中 提 到 的 角色 和 道具 上 。 这 样 便 得 到 了 一 种 对 故事 内 容 的 扩充 表 
示 ,利用 脚本 和 默认 假定 填补 了 故事 中 残缺 的 信息 。 然 后 这 个 程序 便 可 以 通过 引用 脚本 
回答 有 关 这 个 故事 的 问题 了 。 这 种 脚本 使 我 们 可 以 在 适当 的 时 候 应 用 默认 假定 ,这 对 自 
然 语言 理解 来 说 是 至 关 重 要 的 。 例 如 : 
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Script: RESTAURANT Scene 1: Entering 
Track: Coffee Shop 


Props: Tables S PTRANS S into restaurant 
Menu S ATTEND eyes to tables 
F=Food S MBUILD where to sit 
Check S PTRANS S to table 
Money S MOVE S to sitting position 


Scene 2: Ordering 





=Customer (Menu on table) (W brings menu) (S asks for menu) 
W=Waiter S PTRANS menu to S S MTRANS signal to Ww 
W PTRANS W to table 
W PTRANS W to table S MTRANS 'need menu' to Ww 
W ATRANS menu to S W PTRANS W to menu 





MTRANS food list to CP (S) 
MBUILD choice of F 

MTRANS signal to W 

PTRANS W to table 

MTRANS "IT want F' tow 


Mennon 


W PTRANS W to C 
W MTRANS (ATRANS F)to C 
C MTRANS'no F'to Ww 
W PTRANS W to S 
W MTRANS'no F'to S 
(go back to*) or C Do(prepare F script) 
(go to Scene 4 at no pay path) to Scene 3 


Entry conditions: S is hungry. 


S has money. Scene 3: Eating 

Results: S has less money 
O has more money C ATRANS F to Ww 
S is not hungry W ATRANS F to S 


S is pleased(optional) S INGEST F 


(Option: Return to Scene 2 to order more; 
otherwise,go to Scene 4) 


Scene 4:: Exiting S MTRANS to W 
(W ATRANS Check to S) 
MOVE (write check) 
PTRANS W to S 
ATRANS check to S 
ATRANS tip to W 
PTRANS S to M 
ATRANS money to M 
PTRANS S to out of restaurant 
(No pay path) 


中 四 四 划 于 习 卫 











图 2-26 ”饭店 脚本 


场景 1 

昨天 晚上 , 熊 伟 去 饭店 吃饭 ,他 点 了 一 份 牛排 。 付 账 时 发 现 没 有 带 钱 , 于 是 匆忙 赶 回 
家 ,当时 天 已 经 开始 下 十 了。 

利用 这 一 脚本 ,系统 可 以 正确 地 回答 很 多 问题 ,例如 : 熊 伟 昨 晚 吃 晚餐 了 吗 (故事 中 
仅仅 隐 含 了 这 一 点 )? 熊 伟 使 用 现金 或 者 信用 卡 了 吗 ? 熊 伟 如 何 拿 到 菜单 的 ? 熊 伟 买 什 
么 了 ? 
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场景 2 

张 字 到 外 面 吃 午饭 。 她 坐 到 一 张 桌子 旁 , 然 后 巴 来 女 服务 员 , 女 服务 员 递 给 她 菜单 。 
她 点 了 一 份 三 明治 。 

关于 这 个 故事 ,可 以 提出 的 合理 问题 包括 : 为 什么 服务 员 递 给 张 宇 菜单 ? 张 宇 当 时 
是 在 饭店 中 吗 (本 例 并 没有 说 张 宇 在 饭店 中 )? 谁 付 的 账 ? 点 三 明治 的 “她 ?是 谁 ? 最 后 一 
个 问题 是 有 难度 的 。 文 中 最 后 一 次 明确 提 到 的 女性 是 服务 员 , 但 这 是 错误 的 代词 指 代 。 
脚本 的 角色 任务 可 以 帮助 我 们 解决 这 种 指 代 问题 以 及 其 他 模棱两可 问题 。 

脚本 还 可 以 用 来 解释 意外 结果 或 者 是 脚本 行为 中 的 中 断 。 因 此 ,在 图 2-26 的 第 2 场 
中 ,有 一 个 关于 为 顾客 上 了 食物 (“food”) 或 者 是 没有 上 食物 (“no food”) 的 选择 点 。 这 样 
便 可 以 理解 下 面 的 例子 了 。 

场景 3 

张 请 去 饭店 。 女 服务 员 介 绍 她 到 一 张 桌子 边 ,点 了 一 份 三 明治 。 她 坐 在 那里 等 了 很 
久 。 最 后 ,她 等 得 太 焦急 便 离开 了 。 

利用 饭店 脚本 可 以 回答 的 关于 这 个 故事 的 问题 包括 : 坐 在 那里 等 的 “她 ?是 谁 ? 她 为 
什么 等 ? 等 得 焦急 了 离开 的 “她 ?是 谁 ? 她 为 什么 焦急 ? 注意 还 有 一 些 问 题 这 个 脚本 没 法 
回答 ,如 为 什么 当 服务 员 没有 迅速 来 时 人 们 会 焦急 ?和 任何 知识 库 系统 一 样 , 脚 本 需要 知 
识 工 程 师 正 确 预 测 所 需 的 知识 。 

脚本 ,像框 架 和 其 他 结构 化 表示 一 样 , 都 受制 于 特定 的 问题 ,包括 脚本 匹配 问题 和 暗 
示 问 题 。 考 虑 场景 4, 它 还 调用 了 饭店 或 音乐 会 脚本 。 如 何 做 出 选择 是 很 关键 的 ,因为 
“bill" 既 可 以 指 饭店 的 账单 ,也 可 以 指 音乐 会 的 节目 单 。 

场景 4 

能 伟 在 听 音 乐 会 的 路 上 顺便 到 了 他 最 喜欢 的 一 家 饭店 。 他 对 账单 /节目 单 (bill) 很 满 
意 ,因为 他 喜爱 莫扎特 。 

因为 选取 脚本 通常 是 基于 “关键 字 ” 匹 配 的 ,所 以 很 多 时 候 很 难 判 断 应 该 使 用 两 个 或 
更 多 个 可 能 脚本 中 的 哪 一 个 。 目 前 的 所 有 算法 都 不 能 保证 做 出 正确 的 选择 ,从 这 个 意义 
上 来 说 ,脚本 匹配 是 一 个 难度 很 大 的 问题 。 它 需要 关于 世界 组 织 的 启发 性 知识 ,甚至 可 能 
需要 一 些 以 往 知 识 , 脚 本 仅仅 有 助 于 组 织 这 一 知识 。 

暗示 问题 也 是 很 难 的 ,因为 事先 不 可 能 知道 某 个 可 能 事件 会 打 断 脚本 。 组 织 和 检索 
知识 的 问题 很 难 。 即 使 要 理解 简单 的 童话 ,也 需要 大 量 的 知识 。 利 用 脚本 和 其 他 语义 表 
示 的 程序 可 以 在 有 限 的 领域 中 理解 自然 语言 。 这 项 工作 的 一 个 例子 是 翻译 电报 消息 的 程 
序 。 利 用 关于 自然 灾害 政变 或 者 其 他 惯例 故事 的 脚本 ,这些 程 序 已 经 在 这 一 有 限 却 很 实 
际 的 领域 中 取得 了 很 大 的 成 功 。 


2.9 知识 图 谱 


知识 图 谱 (Knowledge Graph,KG) 引 在 描述 客观 世界 的 概念 实体 、 事 件 及 其 之 间 的 
关系 。 其 中 ,概念 是 指 人 们 在 认识 世界 过 程 中 形成 对 客观 事物 的 概念 化 表示 ,如 人 动物 、 
组 织 机 构 等 ;实体 是 客观 世界 中 的 具体 事物 ,如 篮球 运动 员 姚明 、 互 联网 公司 腾讯 等 ;事件 
是 客观 世界 的 活动 ,如 地 震 、 买 卖 行为 等 。 关 系 描述 概念 实体、 事件 之 间 客 观 存 在 的 关联 
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关系 ,如 毕业 院 校 描述 了 一 个 人 与 他 学 习 所 在 学 校 之 间 的 关系 ,运动 员 和 篮球 运动 员 之 间 
的 关系 是 概念 和 子 概念 之 间 的 关系 等 。 谷 歌 于 2012 年 5 月 推出 谷歌 知识 图 谱 ,并 在 其 搜 
索引 擎 中 增强 搜索 结果 ,标志 着 大 规模 知识 在 互联 网 语义 搜索 中 的 成 功 应 用 。 


2.9.1 知识 图 谱 及 其 表示 


知识 图 谱 本 质 上 是 语义 网 络 ,是 一 种 基于 图 的 数据 结构 ,由 结 点 (point) 和 边 (edge) 
组 成 。 在 知识 图 谱 中 , 结 点 表示 现实 世界 中 存在 的 “实体 ”", 边 表示 实体 与 实体 之 间 的 “ 关 
系 ”。 知 识 图 谱 是 关系 的 最 有 效 的 表示 方式 。 通 俗 地 讲 ,知识 图 谱 就 是 把 所 有 不 同 种 类 的 
信息 (heterogeneous information) 连 接 在 一 起 而 得 到 的 一 个 关系 网 络 。 知 识 图 谱 提 供 了 
从 “关系 ”的 角度 去 分 析 问 题 的 能 力 。 知 识 图 谱 这 个 概念 最 早 由 Google 提出 ,主要 用 来 优 
化 现 有 的 搜索 引擎 。 

在 知识 图 谱 中 ,每 个 实体 或 概念 都 有 一 个 唯一 的 标识 符 , 其 属性 用 来 刻画 实体 的 内 在 
特性 ,而 关系 用 来 连接 两 个 实体 ,刻画 它们 之 间 的 关联 (图 2-27) 。 








.+。 -WA +- 
电影 其 他 主演 
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出 生日 其 
前 男友 










图 2-27 ”知识 图 谱 示意 图 


不 同 于 基于 关键 词 搜索 的 传统 搜索 引擎 ,知识 图 谱 可 用 来 更 好 地 查询 复杂 的 关联 信 
息 ,从 语义 层面 理解 用 户 意图 ,改进 搜索 质量 。 例 如 ,在 百度 的 搜索 框 里 输入 "章子怡 ?的 
时 候 , 搜 索 结果 页 面 的 右 侧 还 会 出 现 章子怡 相关 的 信息 ,如 出 生年 月 家庭 情 况 等 。 另 外 ， 
对 于 稍微 复杂 的 搜索 语句 ,如 “章子怡 的 丈夫 是 谁 ?”, 百 度 能 准确 返回 她 的 丈夫 是 汪峰 。 
这 就 说 明 搜索 引擎 通过 知识 图 谱 真 正 理解 了 用 户 的 意图 。 

假设 用 知识 图 谱 描述 一 个 事实 (fact) 一 一 李 荣 是 李 卉 的 父亲 ”。 这 里 的 实体 是 李 荣 
和 李 卉 ,关系 是 “父亲 ”(is_father_of) 。 当 然 , 李 荣 和 李 卉 也 可 能 会 跟 其 他 人 存在 某 种 类 
型 的 关系 (暂时 不 考虑 )。 当 我 们 把 电话 号 码 也 作为 结 点 加 入 到 知识 图 谱 以 后 (电话 号 码 
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也 是 实体 ), 人 和 电话 之 间 也 可 以 定义 一 种 关系 叫 has_phone。 也 就 是 说 , 某 个 电话 号 码 
属于 某 个 人 。 图 2-28 就 展示 了 这 两 种 不 同 的 关系 。 


@ 

















is_father_of 





has_phone 





图 2-28 ”知识 图 谱 示例 


另外 ,可 以 把 时 间作 为 属性 (property) 添 加 到 has_phone 关系 里 表示 开通 电话 号 码 
的 时 间 。 这 种 属性 不 仅 可 以 加 到 关系 里 .还 可 以 加 到 实体 中 , 当 我 们 把 所 有 这 些 信 息 作 为 
关系 或 者 实体 的 属性 添加 后 ,所 得 到 的 图 谱 称 为 属性 图 (property graph) 。 属 性 图 和 传统 
的 RDF 格式 都 可 以 作为 知识 图 谱 的 表示 和 存储 方式 。 

知识 图 谱 是 基于 图 的 数据 结构 , 它 的 存储 方式 主要 有 两 种 形式 : RDF 存储 格式 和 图 
数据 库 (graph database) 。 


2.9.2 百度 知识 图 谱 技 术 方 案 


大 数据 时 代 , 知 识 图 谱 技 术 需 要 处 理 亿 级 甚至 千 亿 级 的 海量 数据 ,面临 数据 异 构 繁 
杂 , 知 识 表 达 多 样 , 图 谱 关系 复杂 ,计算 性 能 要 求 高 等 多 方面 的 挑战 。 为 了 应 对 这 些 挑战 ， 
百度 建立 并 实现 了 面向 通用 域 的 知识 图 谱 构 建 一 一 知识 图 谱 计 算 一 一 知识 图 谱 应 用 的 全 
流程 机 制 及 方案 ,如 图 2-29 所 示 。 百 度 知识 图 谱 整体 技术 方案 有 5 个 方面 : 面向 海量 数 
据 的 知识 图 谱 构 建 技术 .大 规模 知识 图 谱 补 全 技术 、 智 能 知识 图 谱 认 知 技术 .超大 规模 高 
性 能 分 布 式 图 索引 及 存储 计算 技术 和 知识 图 谱 应 用 技术 。 





数据 源 图 谱 构建 与 计算 应 用 
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图 2-29 百度 知识 图 谱 技 术 视图 
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面向 海量 数据 的 知识 图 谱 构建 技术 研究 的 是 知识 挖掘 、 知 识 图 谱 化 相关 方法 与 技术 ， 
包括 知识 图 谱 数据 表示 与 表达 ,针对 海量 开放 资源 的 知识 自动 化 抽取 、 清 洗 、 归 一 、 融 合 方 
法 ,实现 大 规模 知识 图 谱 构建 。 大 规模 知识 图 谱 补 全 技术 是 基于 已 有 知识 图 谱 开 展 的 知 
识 挖掘 ,对 缺失 的 图 谱 关系 进行 补 全 ,包括 通用 实体 关系 .概念 上 下 位 体系 等 ,并 建立 实体 
与 外 延 数据 的 关联 。 智 能 知识 图 谱 认 知 技术 主要 研究 基于 给 定 知识 图 谱 的 深度 语义 解析 
技术 ,实现 对 复杂 开放 文本 语义 的 深度 理解 ,包括 实体 标注 .概念 标注 .谓词 标注 . 子 图 关 
联 、 知 识 推 理 、 知 识 计算 等 。 超 大 规模 高 性 能 分 布 式 图 索引 及 存储 计算 技术 研究 面向 海量 
知识 数据 的 图 存储 、 图 索引 、 图 计算 和 应 用 框架 技术 ,以 实现 知识 图 谱 的 规模 化 生产 和 应 
用 。 知 识 图 谱 应 用 技术 实现 知识 图 谱 在 搜索 、 问 答 、 对 话 、 自 动 内 容 生 产 等 产品 中 的 规模 
化 应 用 。 
1. 知识 表示 与 知识 整合 

在 开放 领域 大 规模 知识 图 谱 构 建 过 程 中 ,需要 面临 海量 知识 图 谱 数 据 自动 化 抽取 、 清 
洗 . 归 一 、 融 合 的 问题 。 为 了 解决 这 些 问题 ,百度 以 全 网 数据 为 输入 ,研究 知识 表示 与 表 
达 、 知 识 归 一 的 相关 方法 与 技术 。 知 识 图 谱 schema 是 知识 图 谱 的 元 数据 , 它 定 义 了 知识 
图 谱 的 核心 数据 模型 以 及 用 以 描述 物理 世界 的 词汇 体系 。 词 汇 体系 既 要 符合 大 众 认 知 、 
满足 常见 应 用 场景 所 需 , 又 要 满足 特殊 场景 或 专业 领域 词汇 定义 的 需求 。 另 外 ,为 了 提升 
大 规模 知识 图 谱 构建 任务 并 行 化 效率 ,需要 对 不 同 领域 或 行业 的 图 谱 schema 并 行进 行 
定义 和 扩展 。 

百度 知识 图 谱 schema 对 W3C RDF/RDFS 进行 了 扩展 ,定义 了 “属性 约束 ”的 类 ,与 
“类 “属性 ”一 起 ,构成 了 知识 图 谱 的 核心 数据 模型 ,并 提供 属性 的 重 载 机 制 支持 属性 多 
态 。 同 时 ,在 保证 知识 图 谱 schema 的 统一 性 ,标准 性 、 严 并 性 前 提 下 ,引入 了 schema 可 
分 支 定义 的 扩展 机 制 ,提高 了 构建 效率 。 

实体 归 一 是 指 对 多 源 异 构 数据 源 上 具有 不 同 ID 但 却 代 表 真 实 世 界 中 同一 对 象 的 实 
体 间 进行 辨识 ,归并 成 一 个 具有 全 局 唯一 标识 的 实体 ,进而 添加 至 知识 图 谱 。 面 对 开放 领 
域 上 数 十 亿 规模 实体 间 归 一 的 挑战 ,百度 提出 了 基于 语义 空间 变换 的 实体 归 一 技术 ,采用 
低 成 本 方式 自动 生成 训练 数据 ,以 及 支持 超大 规模 数据 的 实体 分 区 技术 ,攻克 了 全 网 多 源 
实体 归 一 融合 数据 规模 大 、 准 确 率 要 求 高 的 难题 。 

2. 开放 知识 挖掘 

在 知识 图 谱 构建 过 程 中 , 另 一 个 重要 的 挑战 是 从 海量 资源 中 获取 一 切 可 信 知 识 ,构建 
实体 ,并 为 实体 挖掘 精准 .连贯 .吸引 力 强 的 短 摘要 。 例 如 ,通过 网 页 抽取 有 价值 的 信息 ， 
如 图 2-30 所 示 。 

为 了 应 对 大 规模 知识 获取 的 挑战 .百度 提出 了 开放 知识 挖掘 技术 ,如 图 2-31 所 示 。 
该 技术 首次 将 属性 体系 的 自动 发 现 技术 与 开放 知识 挖掘 结合 ,突破 了 依赖 人 工 建设 属性 
体系 的 瓶颈 ,将 知识 图 谱 属 性 体系 规模 量 增加 10 倍 。 该 技术 融合 了 前 人 工作 中 开放 知识 
挖掘 与 属性 发 现 两 类 工作 的 优势 ,并 进一步 将 发 现 的 新 属性 与 已 有 属性 体系 进行 归 一 整 
合 , 有 效 地 提升 了 给 定 属性 体系 下 知识 挖掘 工作 的 可 扩展 性 。 

3. 知识 图 谱 认 知 技术 

人 类 智能 的 特点 之 一 是 可 以 轻松 地 联想 到 文本 背后 隐 含 的 知识 ,直接 理解 文本 的 深 
层 含义 ,而 机 器 却 很 难 做 到 。 例 如 , 当 人 们 看 到 “桃园 结义 ”时 就 会 联想 到 三 国 , 联 想到 刘 
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图 2-30 知识 抽取 示例 


开放 知识 提取 属性 体系 建设 


杨 国 智 ， 男 ， 生 于 

全 四 川 | 一 = | Spo:[ 杨 国 智 , 任职 -= | 
省 间 中 市 人 ， 现 任 于 ， 蚀 县 第 一 中 学 ] 
黄 嘉 玲 


下 Spo:[ 黄 嘉 玲 ， 就 职 
华人 )| | 于 ，《 全 球 华人 》 | “| 
杂志 社 



















“ 杨 国 智 ”人 黄 嘉 玲 " 
映射 到 类 别 : 人 物 























图 2-31 融合 属性 体系 自动 扩展 的 开放 知识 挖掘 技术 


备 , 关 羽 和 张 飞 , 而 目前 的 搜索 引擎 却 只 能 “看 到 ”这 个 词 本 身 。 如 何 让 搜索 引擎 也 像 人 一 
样 思考 ,从 而 帮助 用 户 更 好 地 获取 所 需 , 是 文本 理解 领域 的 一 个 难题 。 知 识 图 谱 为 文本 理 
解 提 供 了 丰富 的 背景 知识 ,为 实现 认 知 智能 提供 了 必需 的 知识 支撑 。 百 度 知 识 图谱 通 过 
基于 知识 的 概念 意图 标注 算法 ,构建 了 基于 海量 用 户 行为 挖掘 、 深 度 语义 相似 、 函 数 式 语 
义 树 的 语义 形式 化 技术 ,解决 了 开放 空间 下 面向 复杂 中 文 语义 的 知识 图 谱 理 解 认 知 问题 ; 
研发 了 知识 计算 语言 (KCL) 和 多 层 知识 计算 算 子 群 ,实现 了 智能 多 层级 知识 推理 计算 引 
擎 。 基 于 知识 图 谱 的 认 知 技术 在 应 用 中 可 以 做 到 意图 理解 .用 户 理解 以 及 资源 理解 。 

对 文本 等 资源 进行 深入 理解 ,需要 庞大 的 知识 数据 支撑 。 目 前 ,针对 文本 资源 的 理 
解 ,业界 主要 利用 传统 自然 语言 处 理 (Natural Language Processing，NLP) 及 基于 深度 神 
经 网 络 (Deep Neural Networks, DNN) 艇 入 的 语义 理解 。 但 针对 一 些 具体 的 应 用 场景 ， 
如 搜索 和 问答 等 ,其 技术 效果 、 可 计算 及 推理 性 、 可 解释 性 等 方面 均 无 法 满足 需求 。 为 此 ， 
百度 提出 了 一 些 新 的 方法 : 基于 知识 图 谱 进 行 语义 理解 的 子 图 关联 技术 ,利用 实体 嵌入 
(entity embedding) 技 术 隐 式 表 征 实体 ,以 及 基于 DNN 的 Type 语 境 搭配 预测 ,解决 弱 语 
境 下 歧义 消解 问题 ;利用 二 步 关联 技术 降低 计算 代价 的 同时 提升 整体 关联 效果 ;基于 知识 
库 构 建 了 四 大 特征 网 络 , 即 ISA 网 络 、 共 现 网 络 、 词 汇 搭配 网 络 和 语义 网 络 ; 基 于 自 启动 
随机 游 走 技术 计算 并 控制 概念 泛 化 相关 性 。 子 图 关联 技术 从 实体 、 概 念 泛 化 、 意 图 等 不 同 


吉 2 葛 和 碎 表 示 和 和 准 理 一 101 


维度 对 其 进行 表示 ,协助 提供 上 层 认 知 所 需 的 语义 理解 ,并 支撑 基于 知识 的 计算 与 推理 。 

4. 超大 规模 高 性 能 分 布 图 索引 及 存储 计算 技术 

知识 图 谱 的 规模 化 存储 、 检 索 和 计算 能 力 ,是 影响 知识 图 谱 实 用 化 的 3 个 关键 能 力 。 
百度 知识 图 谱 在 生产 和 服务 过 程 中 面临 大 量 的 挑战 。 为 了 应 对 这 些 挑 战 ,百度 实现 了 一 
套 完 整 的 知识 图 谱 生产 架构 ,包括 分 布 式 图 数据 库 、 实 时 流 式 处 理 框架 .分 布 式 批量 处 理 
框架 等 ,能 够 达到 全 网 类 型 的 百 亿 级 知识 图 谱 数据 的 存储 和 随机 访问 , 秒 级 实时 处 理 的 系 
统 能 力 。 同 时 研发 了 一 套 完整 的 图 索引 、 图 检索 和 应 用 框架 技术 ,实现 了 大 规模 知识 库 实 
时 高 并 发 的 图 语法 查询 计算 服务 ,支持 表达 丰富 、 可 灵活 扩展 的 图 查询 逻辑 ,突破 了 图 结 
构 数据 查询 和 应 用 的 功能 及 性 能 瓶颈 。 





2.9.3 案例 : 知识 图 谱 在 互联 网 金融 行业 中 的 应 用 


知识 图 谱 将 互联 网 的 信息 表达 成 更 接近 人 类 认 知 世界 的 形式 ,提供 了 一 种 更 好 地 组 
织 ,管理 和 理解 互联 网 海量 信息 的 能 力 。 知 识 图 谱 给 互联 网 语义 搜索 带 来 了 活力 ,同时 也 
在 智能 问答 、 大 数据 分 析 与 决策 中 显示 出 强大 威力 ,已 经 成 为 互联 网 基于 知识 的 智能 服务 
的 基础 设施 。 知 识 图 谱 与 大 数据 和 深度 学 习 一 起 ,成 为 推动 人 芽 智 能 发 展 的 核心 驱动 力 
之 一 

知识 图 谱 技 术 是 指 在 建立 知识 图 谱 中 使 用 的 技术 ,是 融合 认 知 计算 、 知 识 表示 与 扒 
理 、 信 息 检 索 与 抽取 ,自然 语言 处 理 与 语义 Web 数据 挖掘 与 机 器 学 习 等 的 交叉 研究 。 知 
识 图 谱 研究 ,一 方面 探索 从 互联 网 语言 资源 中 获取 知识 的 理论 和 方法 ; 另 一 方面 促进 知识 
驱动 的 语言 理解 研究 。 随 着 大 数据 时 代 的 到 来 ,研究 从 大 数据 中 挖掘 隐 含 的 知识 理论 与 
方法 ,将 大 数据 转化 为 知识 ,增强 对 互联 网 资源 的 内 容 理解 ,将 促进 当代 信息 处 理 技术 从 
信息 服务 向 知识 服务 转变 。 

下 面 以 知识 图 谱 在 互联 网 金融 行业 中 的 应 用 为 例 进 行 说 明 。 

1.， 反 欺诈 

反 欺诈 是 风 控 中 非常 重要 的 一 道 环节 。 基 于 大 数据 的 反 欺 诈 的 难点 在 于 如 何 把 不 同 
来 源 的 数据 (结构 化 , 非 结 构 ) 整 合 在 一 起 ,并 构建 反 欺诈 引擎 ,从 而 有 效 地 识别 出 欺诈 案 
件 ( 如 身份 造假 .团体 欺诈 、 代 办 包装 等 )。 而 且 不 少 欺诈 案件 会 涉及 复杂 的 关系 网 络 , 这 
也 给 欺诈 审核 带 来 了 新 的 挑战 。 知 识 图 谱 作 为 关系 的 直接 表示 方式 ,可 以 很 好 地 解决 这 
两 个 问题 。 首 先 , 知 识 图 谱 提 供 非常 便捷 的 方式 添加 新 的 数据 源 。 其 次 ,知识 图 谱 本 身 就 
是 用 来 表示 关系 的 ,这 种 直观 的 表示 方法 可 以 帮助 我 们 更 有 效 地 分 析 复 杂 关 系 中 存在 的 
特定 的 潜在 风险 。 

反 欺诈 的 核心 是 人 ,首先 需要 把 与 借款 人 相关 的 所 有 的 数据 源 打通 ,并 构建 包含 多 数 
据 源 的 知识 图 谱 , 从 而 整合 成 为 一 台 机 器 可 以 理解 的 结构 化 的 知识 。 这 里 ,我 们 不 仅 可 以 
整合 借款 人 的 基本 信息 (如 申请 时 填写 的 信息 ), 还 可 以 把 借款 人 的 消费 记录 ,行为 记录 、 
网 上 的 浏览 记录 等 整合 到 整个 知识 图 谱 里 ,从 而 进行 分 析 和 预测 。 这 里 的 一 个 难点 是 很 
多 的 数据 都 是 从 网 络 上 获取 的 非 结构 化 数据 ,需要 利用 机 器 学 习 、 自 然 语言 处 理 技术 把 这 
些 数 据 变 成 结构 化 的 数据 。 
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2. 不 一 致 性 验证 

不 一 致 性 验证 涉及 知识 的 推理 。 可 以 将 知识 的 推理 理解 成 “链接 预测 ”, 也 就 是 从 已 
有 的 关系 图 谱 里 推导 出 新 的 关系 或 链接 。 

不 一 致 性 验证 可 用 来 判断 一 个 借款 人 的 欺诈 风险 ,这 与 交叉 验证 类 似 。 例 如 ,借款 人 
张 三 和 借款 人 李 四 填 写 的 是 同一 个 公司 电话 ,但 张 三 填 写 的 公司 和 李 四 填 写 的 公司 完全 
不 一 样 ,这 就 成 了 一 个 风险 点 ,需要 审核 人 员 格 外 注意 。 

3. 组 团 欺 诈 

相 比 虚假 身份 的 识别 ,组 团 欺 诈 的 挖掘 难度 更 大 。 这 种 组 织 在 非常 复杂 的 关系 网 络 
里 隐藏 着 ,不 容易 被 发 现 。 只 有 把 其 中 隐 含 的 关系 网 络 梳理 清楚 , 才 有 可 能 分 析 并 发 现 其 
中 潜在 的 风险 。 知 识 图 谱 作 为 天 然 的 关系 网 络 的 分 析 工 具 , 可 以 帮助 我 们 更 容易 地 识别 
这 种 潜在 的 风险 。 例 如 ,有 些 组 团 欺诈 的 成 员 会 用 虚假 的 身份 申请 贷款 ,但 部 分 信息 是 共 
享 的。 图 2-32 大 概 说 明了 这 种 情形 。 从 图 中 可 以 看 出 张 三 、 李 四 和 王 五 之 间 没 有 直接 的 
关系 ,但 通过 关系 网 络 我 们 很 容易 看 出 这 三 者 之 间 都 共享 着 某 一 部 分 信息 ,这 就 让 我 们 马 
上 联想 到 欺诈 风险 。 


图 2-32 ”组团 欺 诈 知识 图 谱 示 例 


4. 失 联 客户 管理 

除了 贷 前 的 风险 控制 以 外 ,知识 图 谱 也 可 以 在 贷 后 发 挥 其 强大 的 作用 。 例 如 ,在 贷 后 
失 联 客户 管理 的 问题 上 ,知识 图 谱 可 以 帮助 我 们 挖掘 出 更 多 潜在 的 新 的 联系 人 ,从 而 提高 
催收 的 成 功率 。 

现实 中 ,不 少 借款 人 在 借款 成 功 后 出 现 不 还 款 现象 ,而 且 玩 “ 提 迷 藏 ", 联 系 不 上 本 人 。 
即便 试图 联系 借款 人 曾经 提供 过 的 其 他 联系 人 ,但 还 是 没有 办 法 联系 到 本 人 。 这 就 进入 
了 所 谓 的 “ 失 联 "状态 ,使 得 催收 入 员 也 无 从 下 手 。 那 接 下 来 的 问题 是 ,在 失 联 的 情况 下 ， 
我 们 有 没有 办 法 去 挖掘 与 借款 人 有 关系 的 新 的 联系 人 ? 而 且 这 部 分 人 群 并 没有 以 关联 联 
系 人 的 身份 出 现在 我 们 的 知识 图 谱 里 。 如 果 我 们 能 够 挖掘 出 更 多 潜在 的 新 的 联系 人 ,就 
会 大 大 地 提高 催收 成 功率 。 例 如 ,在 下 面 的 关系 图 (图 2-33) 中 ,借款 人 跟 李 四 有 直接 的 
关系 ,但 我 们 却 联 系 不 上 李 四 。 那 有 没有 可 能 通过 二 度 关系 的 分 析 , 预 测 并 判断 哪些 李 四 
的 联系 人 可 能 会 认识 借款 人 。 这 就 涉及 图 谱 结 构 的 分 析 。 
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图 2-33 失 联 客户 知识 图 谱 示 例 


2.10 基于 知识 的 系统 


如 果 说 自动 推理 主要 侧重 在 物理 系统 的 运行 过 程 ( 即 符号 机 器 ) 上 ,基于 知识 的 智能 
则 强调 符号 的 结构 和 符号 的 含义 。 基 于 知识 的 智能 在 物理 符号 系统 假设 的 基础 上 增加 了 
另 一 个 基本 假说 ,这 就 是 Brian Smith 于 1985 年 提出 的 知识 表示 假说 ,这 个 假设 指 任何 机 
械 地 展现 智能 的 过 程 都 将 由 一 组 结构 化 的 成 分 组 成 ,这 些 成 分 一 是 作为 外 部 观察 者 的 人 
会 自然 地 采用 的 ,以 表示 整个 过 程 所 展示 的 知识 的 命题 式 解 释 ,二 是 独立 于 这 样 的 外 部 语 
义 归属 ,并 在 使 展示 该 知识 的 行为 发 生 的 过 程 中 起 重要 作用 。 这 个 假说 隐 含 了 两 个 重要 
假定 ,第 一 ,知识 将 按 命 题 表 示 , 也 就 是 说 ,按照 被 外 部 观察 者 看 作 是 对 该 知识 而 言 的 “ 自 
然 " 描 述 的 形式 , 显 式 地 表示 知识 ;第 二 ,系统 的 行为 能 够 被 看 成 是 被 知识 库 中 的 命题 形式 
地 引发 的 ,并 且 这 个 行为 应 该 与 我 们 领悟 的 这 些 命题 的 含义 一 致 


2.10.1 知识 获取 


知识 的 获取 是 人 们 所 关注 的 问题 ,在 互联 网 环境 下 ,知识 的 获取 又 有 其 新 的 特点 。 互 
联网 是 人 类 有 史 以 来 面 对 的 最 巨大 的 信息 海洋 ,其 中 的 信息 具有 海量 ,形式 多 样 .动态 变 
化 ,矛盾 知识 普遍 存在 等 特点 。 要 从 中 获取 知识 ,就 必须 建立 起 从 数据 搜集 、 整 理 到 知识 
抽取 的 完整 的 知识 获取 理论 和 技术 。 

互联 网 上 的 信息 源 形 式 多 样 , 既 有 结构 化 的 数据 库 中 的 数据 ,又 有 半 结 构 化 的 
HTML 页 面 ,还 有 无 结构 的 文本 和 图 片 等 数据 。 根 据 不 同 的 数据 形式 ,必须 运用 相应 的 
知识 获取 技术 ,才能 有 效 地 获得 需要 的 知识 。 

对 于 存储 在 传统 数据 库 系统 中 的 结构 化 数据 ,从 中 发 现 知识 的 技术 称 为 数据 挖掘。 
数据 挖掘 技术 在 数据 库 领 域 已 经 有 了 广泛 的 研究 ,取得 了 很 多 成 果 。 而 针对 互联 网 上 的 
半 结 构 化 数据 和 文本 数据 ,数据 挖掘 、Web 挖掘 以 及 文本 挖掘 等 技术 则 发 挥 了 较 大 的 
作用 。 

1. 数据 挖掘 

狭义 地 讲 ,数据 挖掘 是 从 大 量 数据 中 提取 或 “挖掘 ?知识 ,只 是 数据 库 中 知识 发 现 过 程 
的 一 个 基本 步骤 ;从 广义 的 角度 看 ,数据 挖掘 是 从 存放 在 数据 库 、 数 据 仓 库 或 其 他 信息 库 
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中 的 大 量 数据 中 挖掘 有 趣 知识 的 过 程 .可 以 看 作 是 另 一 个 常用 的 术语 “数据 库 中 知识 发 
现 ? 或 KDD 的 同义词 。 这 个 广义 的 知识 发 现 过 程 由 以 下 步骤 组 成 。 

(1) 数据 清理 : 该 步 又 主要 包括 对 丢失 值 的 处 理 , 消 除 噪声 或 不 一 致 数据 等 。 

(2) 数据 集成 : 该 步骤 主要 处 理 来 自 不 同 数据 源 的 数据 的 模式 集成 , 宛 余 数据 的 消 
除 ,数据 冲突 的 发 现 和 解决 等 问题 。 

(3) 数据 选择 : 该 步骤 从 数据 库 中 提取 与 分 析 任 务 相关 的 数据 。 

(4) 数据 变换 : 该 步骤 通过 汇总 或 聚集 操作 等 方式 将 数据 转换 或 统一 成 适合 挖掘 的 
形式 。 

(5) 数据 挖掘 : 这 是 最 基本 的 步骤 ,使 用 智能 方法 抽取 数据 模式 。 

(6) 模式 评估 : 该 步骤 根据 某 种 兴趣 度 度 量 , 识 别提 供 知 识 的 真正 有 趣 的 模式 。 

(7) 知识 表示 : 该 步骤 使 用 可 视 化 和 知识 表示 技术 向 用 户 描述 挖掘 出 来 的 知识 。 

根据 上 面 对 广 义 数据 挖掘 的 定义 ,一 个 典型 的 数据 挖掘 系统 应 当 包括 从 基础 数据 存 
储 到 用 户 界面 的 各 个 部 分 ,其 主要 成 分 如 下 。 

(1) 数据 库 ,数据 仓库 或 其 他 信息 库 : 一 个 或 一 组 数据 库 、 数 据 仓库 或 其 他 类 型 的 信 
息 库 ,是 数据 清理 和 集成 步骤 处 理 的 数据 对 象 。 

(2) 数据 库 或 数据 仓库 服务 器 : 负责 根据 用 户 的 数据 挖掘 请 求 提取 相关 数据 。 

(3) 知识 库 : 用 于 指导 搜索 ,或 评估 结果 模式 兴趣 度 的 领域 知识 。 它 可 能 包括 概念 
分 层 . 用 户 知识 兴趣 度 约束 或 闵 值 以 及 元 数据 等 。 

(4) 数据 挖掘 引擎 : 数据 挖掘 系统 基本 的 部 分 ,由 一 组 功能 模块 组 成 ,用 于 特征 、 关 
联 , 分 类 、 聚 类 分 析 \ 演 变 和 偏差 分 析 。 

(5) 模式 评估 模块 : 该 模块 通常 使 用 兴趣 度 度量 ,并 与 挖掘 模块 交互 ,以 便 将 搜索 聚 
焦 在 有 趣 的 模式 上 。 它 可 能 使 用 兴趣 度 阔 值 过 滤 所 发 现 的 模式 。 模 式 评估 模块 也 可 以 与 
挖掘 模块 集成 在 一 起 ,这 依赖 于 数据 挖掘 方法 的 具体 实现 。 

(6) 图 形 用 户 界面 : 该 模块 负责 用 户 与 系统 之 间 的 交互 ,允许 用 户 指定 数据 挖掘 查 
询 或 任务 ,提供 信息 帮助 搜索 聚焦 ,以 及 根据 数据 挖掘 的 中 间 结 果 进 行 探 索 式 数据 挖掘 
等 。 此 外 ,该 模块 还 允许 用 户 浏览 数据 库 和 数据 仓库 模式 ,评估 挖掘 的 模式 ,和 以 不 同 的 
形式 对 模式 进行 可 视 化 。 

数据 挖掘 任务 可 以 在 多 种 类 型 的 数据 存储 和 数据 库 系统 上 进行 , 它 一 般 可 以 分 为 两 
类 : 描述 和 预测 。 描 述 性 挖掘 任务 试图 刻画 数据 库 中 数据 的 一 般 特 性 。 预 测 性 挖掘 任务 
根据 当前 数据 进行 推导 ,以 进行 预测 。 

2. Web 挖掘 

互联 网 的 出 现 提供 了 丰富 的 资源 , 它 包含 涉及 多 个 领域 的 海量 数据 和 大 量 的 超 链 接 
信息 ,为 知识 的 挖掘 和 获取 提供 了 新 的 数据 来 源 。 

然而 ,Web 本 身 的 特点 对 有 效 的 资源 和 知识 发 现 提出 了 许多 新 的 挑战 : 对 有 效 的 
数据 仓库 和 数据 挖掘 而 言 , Web 过 于 庞大 ; @Web 上 的 数据 形式 多 样 , 可 能 结构 复杂 ; 
加 Web 是 一 个 动态 性 极 强 的 信息 源 ; @Web 面 对 的 是 一 个 广泛 的 形形色色 的 用 户 群体 ; 
@Web 上 的 信息 可 能 只 有 部 分 是 相关 的 或 有 用 的 。 

Web 挖掘 可 以 定义 为 : 从 与 WWW 相关 的 资源 和 行为 中 抽取 感 兴趣 的 有 用 的 模式 
和 隐 仿 信息 。Web 挖掘 可 分 为 如 下 3 类 : 四 Web 内 容 挖掘 ; @Web 结构 挖掘 ; @Web 
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使 用 记录 的 挖掘 。 第 11 章 将 具体 阐述 。 

3. 文本 挖掘 

在 Web 环境 下 ,大 量 存在 的 是 各 种 文档 ,如 电子 邮件 、 新 闻 、 电 子 出 版 物 等 。 这 些 文 
档 中 除了 少量 的 结构 内 容 外 ,还 包含 大 量 的 无 结构 的 文本 信息 。 如 何 分 析 和 处 理 这 些 文 
本 信息 一 直 是 人 们 关注 的 问题 。 信 息 检索 领域 已 经 在 这 方面 进行 了 多 年 的 研究 工作 , 提 
出 了 很 多 处 理 技术 。 

将 数据 挖掘 的 技术 应 用 到 文本 处 理 的 领域 进行 文本 挖掘 是 一 个 重要 的 研究 课题 , 目 
前 受到 关注 的 问题 如 下 。 

1) 基于 关键 字 的 关联 分 析 

基于 关键 字 的 关联 分 析 的 目标 是 找 出 经 常 一 起 出 现 的 关键 字 或 词汇 之 间 的 关联 或 相 
互 关系 。 一 组 经 常 连续 出 现 或 紧密 相关 的 关键 字 可 形成 一 个 词 或 词组 ,关联 挖掘 可 以 找 
出 复合 关联 , 即 领域 相关 的 词 或 词组 。 利 用 这 种 词 和 词组 的 识别 ,可 以 进行 更 高 层次 的 关 
联 分 析 , 找 出 词 或 关键 字 间 的 关联 。 

2) 文档 分 类 分 析 

自动 文档 分 类 是 一 种 重要 的 文本 挖掘 工作 ,由 于 现在 存在 大 量 的 联机 文档 ,自动 对 其 
分 类 组 织 ,以 便于 对 文档 进行 检索 和 分 析 。 文 本 文档 的 分 类 与 关系 数据 的 分 类 存在 本 质 
的 区 别 : 关系 数据 是 结构 化 的 ,每 个 元 组 定义 为 一 组 属性 值 ,而 文档 不 是 结构 化 的 , 它 没 
有 属性 值 的 结构 ,与 一 组 文档 相关 的 关键 字 并 不 能 用 一 组 属性 刻画 。 

对 文档 分 类 的 有 效 方法 是 基于 关联 的 分 类 , 它 基 于 一 组 关联 的 、 经 常 出 现 的 文本 模式 
对 文档 加 以 分 类 。 基 于 关联 的 分 类 方法 处 理 过 程 如 下 : 首先 ,通过 简单 的 信息 检索 技术 
和 关联 分 析 技术 提出 关键 字 和 词汇 。 其 次 ,使 用 已 有 的 词类 ,如 WordNet, 或 基于 专家 知 
识 ,或 使 用 某 些 关键 字 分 类 系统 ,可 以 生成 关键 字 和 词 的 概念 层次 。 训 练 集中 的 文档 也 可 
以 分 类 为 类 层次 结构 。 然 后 , 词 关联 挖掘 方法 可 用 于 发 现 一 组 关联 词 , 它 可 以 最 大 化 地 区 
分 文档 类 别 。 这 导致 对 每 一 类 文档 ,都 相关 有 一 组 关联 规则 。 这 些 分 类 规则 可 以 基于 其 
出 现 频率 和 识别 能 力 加 以 排序 ,并 用 于 对 新 的 文档 进行 分 类 。 此 种 基于 关联 的 文档 分 类 
方法 已 经 被 证 明 是 有 效 的 。 对 Web 文档 分 类 ,可 以 利用 Web 页 面 的 链接 信息 ,帮助 识别 
文档 类 。 


2. 10.2 知识 组 织 





互联 网 环境 下 知识 的 组 织 一 一 Web 信息 仓库 : 不 同 的 用 户 有 不 同 的 知识 需求 ,而 知 
识 的 组 织 结构 也 应 与 之 相 适 应 , 即 面向 主题 的 .随时 间 变 化 的 ,多重 粒度 的 、 比 较 稳定 的 。 
虽然 互联 网 中 的 信息 日 新 月 异 ,千变万化 ,但 Web 信息 仓库 中 的 知识 却 是 按 主题 进行 结 
构 化 组 织 的 、 相 对 稳定 的 。Web 信息 仓库 与 大 百科 知识 基础 设施 相 比 是 一 种 动态 的 、 面 
向 某 一 范畴 的 、 比 较 具 体 的 知识 ,也 是 一 种 知识 基础 设施 。 

互联 网 环境 下 知识 的 形式 化 表示 : 对 于 互联 网 中 海量 的 非 结构 化 信息 ,我 们 需要 一 
种 形式 化 的 、 多 层次 的 、 适 应 性 强 的 知识 表达 体系 。 在 建立 这 样 的 知识 表达 体系 时 ,我 们 
不 仅 要 考虑 它 在 数学 上 的 严格 语义 ,而 且 要 考虑 它 在 操作 上 的 有 效 性 (如 易于 知识 推理 、 
知识 查询 ,以 及 与 其 他 知识 系统 间 的 通信 ) 。 
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传统 的 知识 表达 有 如 下 缺点 : 孤立 、 脆 弱 、 解 决 的 是 小 问题 ,研究 者 提出 Semantic 
Web( 语 义 Web) 解 决 以 上 问题 (图 2-34)。Semantic Web 的 语言 标准 是 XML、XML 
Schema、RDF 和 RDF Schema, 本 体 基 础 是 DAML 和 OIL。XML 实际 上 是 一 种 元 语言 ， 
只 是 提供 了 数据 格式 的 约定 , 它 的 主要 标注 实体 是 元 素 , 包括 属性 和 值 。XML 
(eXtensible Markup Language) 并 不 负责 解释 数据 ,只 是 形成 了 有 序 标签 树 。XML 
Schema 定义 了 词汇 (元 素 和 属性 ) 和 用 法 。RDF(Resource Description Framework) 描 述 
的 是 一 个 三 元 组 (对 象 ,属性 , 值 ), 可 用 有 向 标签 图 表示 , 它 提供 了 描述 领域 无 关 元 数据 的 
机 制 , 比 XML 提供 了 更 多 语义 上 的 信息 。 


Rules \ ~ 
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Document 
















































XML+Name space+ XML Schema 





图 2-34 Semantic Web 的 分 层 体 系 图 


在 人 工 智能 中 ,一 般 将 本 体 定义 为 概念 化 的 精细 描述 ,也 可 以 把 本 体 视 为 知识 术语 的 
集合 ,包括 词汇 表 , 语 义 关系 和 一 些 简 单 的 推理 与 逻辑 规则 。 本 体 是 可 共享 概念 化 的 、 规 
范 的 、. 显 式 的 精确 描述 。 概 念 化 是 现象 的 抽象 模型 ,标志 了 现象 的 相关 概念 。 

Semantic Web 的 构造 过 程 如 下 。 

(1) XML 定义 了 树 结 构 的 串 性 语法 ,使 应 用 程序 可 以 直接 访问 语义 数据 。 

(2) RDF 定义 了 句法 约定 及 简单 数据 模型 ,用 于 表达 机 读数 据 语 义 。 

(3) RDFS 引入 更 丰富 的 表达 形式 和 基本 的 本 体 建 模 原 语 ( 类 、 子 类 、 自 属性 \ 域 .区 间 )。 

(4) 以 RDF 为 起 点 ,构造 完善 的 基于 Web 的 本 体 语言 OIL。 


2.10.3 知识 应 用 


从 互联 网 获取 知识 并 保存 到 知识 仓库 以 后 ,这 些 知 识 可 应 用 在 智能 信息 检索 .计算 机 
科学 的 研究 热点 的 抽出 、 新 闻 事 件 追 踪 等 方面 。 

搜索 引擎 一 般 仍 停留 在 基于 关键 词 匹配 的 内 容 检索 阶段 ,无 法 很 好 地 为 用 户 提供 准 
确 有 效 的 信息 服务 。 要 提供 有 效 的 个 性 化 信息 服务 ,就 必须 利用 从 互联 网 中 获取 的 相关 
知识 以 及 建立 有 效 的 用 户 兴 趣 模型 。 

以 自然 语言 理解 作为 从 正文 信息 中 获取 知识 的 基础 。 半 结构 化 数据 处 理 技术 仍然 不 
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能 解决 大 量 存在 的 从 正文 信息 中 获取 知识 的 问题 ,还 需要 在 正文 数据 层面 上 研究 知识 的 
获取 问题 。 在 建立 了 严格 的 知识 本 体 之 后 ,我们 将 采用 自然 语言 理解 技术 从 互联 网 中 具 
体 地 获取 领域 知识 ,对 知识 本 体 进 行 具体 化 。 

将 智能 信息 检索 划分 为 3 个 层面 : 输入 层 、 处 理 层 和 输出 层 。 输 入 层 是 用 户 表 述 信 
息 需 求 的 过 程 ,涉及 文本 分 类 、 查 询 扩 展 和 用 户 兴 趣 建 模 ; 处 理 层 是 系统 检索 出 相关 文档 
的 过 程 ,涉及 访问 模式 分 析 、 链 接 分 析 ; 输 出 层 是 最 终 的 检索 结果 呈现 ,涉及 文本 聚 类 、 自 
动 摘要 。 

输入 层 是 用 户 表 述 信息 需求 的 过 程 ,涉及 文本 分 类 、 查 询 扩展 和 用 户 兴趣 建 模 。 信 息 
检索 系统 的 用 户 按 其 信息 需求 的 明确 程度 可 以 粗略 划分 为 两 类 : 浏览 型 用 户 和 查找 型 用 
户 。 前 者 没有 明确 的 检索 意图 ,需要 在 系统 的 导航 下 触发 ,因此 需要 了 解 系统 内 在 信息 的 
结构 模式 ,如 分 类 体系 ;后 者 一 般 可 以 提供 比较 具体 的 查询 语句 或 关键 词 , 但 由 于 自然 语 
言 描述 的 随意 性 ,需要 系统 进一步 明确 其 查询 目标 ,进行 语义 排 歧 或 查询 扩展 。 

如 何 感 知 用 户 情景 ,探索 知识 适 配 机 理 , 优 化 知识 适 配 模型 是 大 数据 知识 工程 的 一 个 
关键 科学 问题 。 为 此 ,可 通过 “在 线 学 习 -拓扑 融合 -知识 导航 ”3 个 阶段 实现 碎片 化 知识 的 
“ 量 - 质 - 序 ” 转 化 与 应 用 问题 求解 。 吴 信和 东 等 人 提出 ,需要 重点 解决 如 下 8 方面 的 问题 。 

(1) 碎片 化 知识 表示 /知识 艇 表示。 碎片 化 知识 表示 是 知识 挖掘 、 融 合 的 前 提 。 针 对 
碎片 化 知识 的 高 维 、 稀 朴 、 低 质 . 分 面 等 特性 ,可 采用 深度 学 习 方法 对 碎片 化 知识 与 语义 联 
系 进行 建 模 ,实现 分 布 式 环境 下 可 淹 源 的 碎片 化 知识 和 知识 簇 表 示 。 

(2) 碎片 化 知识 在 线 挖掘 和 协同 学 习 。 可 构建 基于 稀 朴 表示 的 概念 漂移 和 演化 模 
型 ,解决 概念 漂移 学 习 时 间 窗 的 时 空 代价 问题 :通过 概率 图 模型 稀 朴 分 布 的 共享 优化 , 实 
现 碎 片 化 知识 的 多 维度 协同 学 习 。 

(3) 基于 时 序 特性 分 析 的 知识 演化 模型 。 针 对 碎片 化 知识 的 更 新 和 动态 变化 特点 ， 
采用 融合 时 序 特征 的 演化 模型 变 结构 学 习 。 为 提升 模型 精准 性 ,采用 知识 演化 下 的 噪声 
清洗 方法 。 

(4) 碎片 化 知识 语义 关联 挖掘 与 涌现 特性 分 析 。 碎 片 化 知识 融合 的 依据 是 知识 之 间 
的 语义 关联 ,可 设计 关联 拓扑 与 深层 语义 特征 相 结合 的 关联 挖掘 算法 ,生成 知识 簇 ;在 此 
基础 上 ,分 析 关 联 拓扑 特性 的 涌现 规律 ,为 知识 融合 提供 理论 支撑 。 

(5) 基于 可 靠 子 图 发 现 的 知识 动态 融合 。 旨 在 融合 碎片 化 知识 ,实现 量 质 转换 与 增 
殖 。 可 将 融合 过 程 看 作 从 知识 簇 对 应 的 不 确定 图 中 发 现 可 靠 子 图 的 过 程 ,采用 知识 簇 中 
可 靠 子 图 发 现 与 变 粒 度 语义 推理 方法 ,并 基于 量子 概率 对 融合 结果 进行 置信 和 度 评 估 。 

(6) 交互 式 情景 感知 。 知 识 导 航 的 前 提 是 感知 用 户 情景 。 可 综合 多 数据 源 、 多 维度 
的 统计 特征 ,构建 融合 交互 行为 ,情感 和 偏好 等 属性 的 情景 感知 模型 。 

(7) 需求 驱动 的 知识 寻 径 。 用 户 情景 具有 多 分 面 ` 个 性 化 特点 ,导致 从 知识 库 中 规划 
出 匹配 用 户 情景 的 知识 导航 路 径 是 一 个 多 元 约 东 满足 问题 。 可 提出 基于 群体 智能 的 知识 
导航 路 径 规 划算 法 ,并 设计 基于 上 下 文 和 焦点 的 导航 路 径 可 视 化 方法 ,引导 用 户 知识 
寻 径 。 

(8) 交互 情景 下 知识 适 配 的 优化 。 依 据 交 互 式 情景 的 “人 人 参与 "和 “逐步 求 精 ” 的 特 
点 ,探讨 知识 适 配 的 作用 机 理 , 利 用 空间 变换 理论 和 元 学 习 理 论 寻求 优化 知识 适 配 的 
模型 。 
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2.10.4 常识 知识 和 大 规模 知识 处 理 


基于 知识 的 智能 的 基本 出 发 点 是 ,强调 知识 的 大 量 积累 可 以 使 计算 机 的 智能 发 生 质 
变 。20 世纪 80 年 代 盛 行 的 专家 系统 是 基于 知识 的 智能 的 典型 代表 ,当时 它们 在 各 自 的 
特定 应 用 领域 发 挥 着 作用 。 但 由 于 应 用 的 不 断 深 入 和 拓展 ,这 些 专 家 系统 的 局 限 性 表现 
得 越 来 越 明 显 。 看 到 限定 领域 专业 知识 所 表现 出 的 局 限 性 之 后 ,人 们 开始 追求 拥有 海量 
知识 和 常识 知识 的 知识 系统 。Lenat 在 1995 年 开始 的 CYC 计划 就 是 要 建 一 个 常识 知识 
库 , 其 理论 基础 是 Edward Feigenbaum 等 人 提出 的 所 谓 * 知 识 原则 ”三 阶段 计划 : 第 一 阶 
段 , 花 10 年 时 间 构 建 一 个 海量 知识 库 , 能 够 回答 大 部 分 人 与 人 之 间 的 问题 ;第 二 阶段 ,再 
花 10 年 时 间 改 进 这 个 知识 库 , 使 得 它 能 够 回答 其 知识 内 容 之 外 的 问题 ;第 三 阶段 ,再 花 
10 年 时 间 改 进 这 个 知识 库 ,使 得 它 能 够 自己 创建 新 的 知识 ,从 而 使 计算 机 具备 人 的 智能 。 
这 是 一 个 野心 勃勃 的 计划 ,许多 人 认为 这 个 计划 难以 实现 ,但 是 Lenat 的 CYC 计划 仍 在 
坚持 进行 中 。 

中 国 科学 院 计算 所 的 曹 存根 主持 了 * 中 国 国家 知识 基础 设施 CCNKID ”计划 。CNKI 
计划 涉及 大 规模 知识 获取 、 分 析 和 利用 的 问题 ,其 目标 是 构建 一 个 庞大 的 、 可 共享 的 知识 
群体 , 它 不 仅 要 集成 各 个 学 科 的 公共 知识 ,还 要 融入 各 学 科 专家 的 个 人 知识 ,并 为 科研 . 教 
学 .科普 和 知识 服务 提供 有 效 的 基础 。CNKI 计划 包含 如 下 研究 工作 。 

(1) 建立 不 同学 科 的 本 体 ,包括 地 理 本 体 、 化 工本 体 、 生 物 本 体 、 中 西医 本 体 、 与 人 相 
关 的 知识 的 本 体 等 ,主要 是 抽取 各 学 科 的 概念 概念 之 间 的 关联 、 概 念 和 关联 的 约束 和 满 
足 的 公理 等 ,构建 概念 层次 和 概念 表示 框架 。 

(2) 研究 知识 分 析 的 方法 , 即 为 了 保证 本 体 知识 库 中 不 存在 语义 问题 ,需要 根据 特定 
领域 的 公理 体系 ,对 概念 的 属性 和 关系 进行 一 致 性 和 完整 性 分 析 。 

(3) 搭建 知识 服务 平台 。 目 前 ,该 平台 由 3 个 部 分 组 成 : 一 个 内 部 平台 ,提供 核心 、 
有 用 服务 和 软件 库 ; @ 一 组 外 部 应 用 ,由 合作 组 织 在 各 种 各 样 的 应 用 领域 开发 ; 四 一 个 
与 外 部 世界 (如 语义 Web) 接 口 的 模块 。 

CNKI 的 本 体 知 识 库 超 过 300 万 条 知识 记录 ,知识 记录 超过 10 亿 条 。 期 望 CNKI 能 
在 任何 时 候 , 任 何 地 点 ,给 任何 需要 它 的 人 提供 知识 ,并 且 支 持 团 体 知识 、 沟 通 和 协作 的 


需要 。 
2.10.5 常识 推理 


“Tom 和 他 的 三 岁 宝贝 儿子 谁 身高 更 高 ?””* 针 扎 入 胡 葛 卜 . 它 会 留 下 小 孔 , 请 问 它 指 
的 是 什么 ”……… 这 些 问 题 看 似 很 傻 ,但 机 器 要 完成 许多 智能 型 任务 (如 文本 理解 .计算 机 视 
觉 . 路 径 规划 、 科 学 推理 等 ) , 却 需要 理解 这 些 常 识 和 相应 的 推理 。 

常识 推理 在 文本 理解 .计算 机 视觉 .机 器 人 操作 和 规划 等 许多 AI 任务 中 有 着 举 足 轻 
重 的 地 位 。 例 如 ,在 自然 语言 处 理 (NLP) 领 域 ,歧义 的 处 理 通常 需要 常识 推理 : The 
electrician is working 和 The telephone is working 中 的 两 个 working, 看 似 都 是 “工作 ”， 
但 第 一 个 working 的 内 涵 为 “劳动 ”, 第 二 个 working 的 内 涵 则 为 “正常 运作 ”。 若 机 器 要 
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理解 到 这 一 层次 ,就 需要 对 人 类 常识 有 一 定 的 积累 。 再 如 ,在 计算 机 视觉 (CV) 领 域 ,机 器 
需要 能 对 “桌布 底下 有 桌子 ”柜子 可 以 通过 把手? 打开 ?这 些 隐 含 的 常识 进行 理解 和 
推理 。 

典型 的 常识 推理 有 类 别 推理 时间 推理 .行动 和 变化 推理 .定性 推理 。 

类 别 推 理 (taxonomic reasoning) : 类 别 推理 的 两 种 形式 为 传递 和 继承 ,如 Bikaqiu 是 
狗 的 一 个 实例 (instance) , 狗 是 哺乳 动物 的 一 个 子 集 (subset) ,那么 Bikaqiu 是 哺乳 动物 的 
一 个 实例 ,这 就 是 传递 。 再 如 , 狗 是 哺乳 动物 的 子 集 ,哺乳 动物 有 "多毛" 的 属性 ,那么 狗 也 
有 这 一 属性 ,这 就 是 继承 性 。 

时 间 推 理 (temporal reasoning): 时 间 推 理 主要 研究 关于 时 间 (times) ,持续 时 间 
(durations) 和 时 间 间 隔 (time intervals) 的 表示 和 推理 。 例 如 ,已 知 莫扎特 早 于 贝多 芬 出 
生 , 并 且 他 死 时 比 贝多 芬 死 时 年 轻 , 那 么 可 以 推出 莫扎特 早 于 贝多 芬 去 世 。 

行动 和 变化 推理 (action and change) : 行动 和 变化 推理 在 满足 某 些 约束 (如 Events 
are atomic、Every change in the world is the result of an event\Events are deterministic 、 
Single actor 和 Perfect knowledge) 的 研究 领域 已 经 取得 了 很 大 的 进展 ,其 主要 成 功 应 用 
于 高 层次 规划 和 机 器 人 规划 。 

定性 推理 (qualitative reasoning) : 定性 推理 主要 分 析 和 推理 具有 内 在 关联 的 数量 之 
间 的 变化 。 例 如 ,如 果 密 闭 容器 内 温度 升 高 ,那么 压力 就 会 增 大 。 定 性 推理 已 经 在 物理 
学 .工程 学 .生物 学 等 许多 领域 得 到 成 功 的 应 用 。 

常识 推理 面临 许多 挑战 。 许 多 涉及 常识 及 推理 的 领域 仍 处 于 对 常识 理解 的 初级 阶 
段 ,甚至 还 尚未 开始 研究 。 对 于 绝 大 多 数 涉 及 常识 推理 的 领域 ,都 还 远 远 没有 达到 深入 理 
解 的 程度 。 许 多 看 似 简 单 的 情景 很 可 能 具有 相当 大 的 逻辑 复杂 性 。 

常识 推理 经 常 涉及 合 情 推理 (plausible reasoning)。 合 情 推 理 是 指 人 们 根据 已 有 的 
信息 进行 看 似 合乎 逻辑 的 推理 ,但 这 样 的 推理 结果 未 必 是 正确 的 。 尽 管 合 情 推 理 已 经 被 
广泛 研究 了 数 年 ,但 仍 是 常识 推理 中 极 具 挑战 性 的 问题 之 一 。 

许多 领域 不 可 避免 地 会 出 现 长 尾 (long tail) 现 象 。 长 尾 现象 指 的 是 高 频 样本 或 对 象 
仅 占 整体 的 一 小 部 分 ,更 多 的 是 一 些 低频 样本 或 对 象 。 

在 知识 的 形式 化 表示 时 ,机 器 往往 很 难 分 辨 出 合适 的 抽象 层次 。 比 如 说 那个 “针头 扎 
入 胡萝卜 ”的 例子 ,机 器 在 推理 时 并 不 知道 “针头 扎 进 胡 葛 卜 , 则 胡萝卜 上 会 有 一 个 孔 ” 这 
一 特定 事实 ,但 它 可 能 知道 更 一 般 的 规则 :“ 尖 锐 物 体 扎 在 其 他 物体 上 ,该 物体 会 有 和 孔 
洞 "。 但 问题 是 如 何 更 广泛 地 、 更 通用 地 制定 这 样 的 规则 呢 ?“ 和 钉子 钉 入 木头 ”“ 订 书 钉 钉 
入 纸 中 “钉子 掉 入 水 中 ?”…… 是 否 应 该 为 每 一 个 这 样 的 小 领域 分 别 制定 规则 呢 ? 这 些 领 
域 又 是 如 何 划分 的 ? …… 每 一 个 问题 都 值得 人 们 深入 思考 。 

常识 推理 的 主要 技术 包括 : 四 基于 知识 的 方法 。 由 专家 分 析 常 识 推理 所 需要 的 特 
征 ,进而 手工 建立 知识 表示 的 方法 和 常识 推理 引擎 。 此 外 ,还 包括 基于 数学 的 方法 、 基 于 
机 器 学 习 和 大 规模 数据 库 的 方法 。@Web 挖掘 的 方法 。 人 们 尝试 利用 Web 挖掘 技术 从 
Web 文档 中 提取 常识 。 图 基于 众 包 的 方法 。 该 方法 可 以 避免 Web 挖掘 方法 中 存在 的 问 
题 ( 如 常识 结果 的 不 一 致 性 ) .但 不 能 得 到 对 于 基本 领域 (fundamental domains) 的 分 析 以 
及 支持 可 靠 推理 所 需 的 不 同 含义 和 类 别 的 精细 区 分 。 
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2.10.6 案例 : 知识 图 谱 应 用 


知识 图 谱 目 前 已 经 应 用 在 智能 搜索 、 实 体 推荐 、 自 动 问答 、 对 话 式 系统 等 产品 中 ,实现 
了 对 传统 搜索 等 应 用 的 智能 化 升级 ,为 用 户 带 来 更 智能 的 应 用 体验 。 

百度 知识 图 谱 2014 年 正式 上 线 至 今 ,服务 规模 增长 了 160 倍 。 百 度 知识 图 谱 依托 海 
量 互 联网 数据 ,综合 运用 语义 理解 ,知识 挖掘 、 知 识 整 合 与 补 全 等 技术 ,提炼 出 高 精度 知 
识 , 并 组 织 成 图 谱 , 进 而 基于 知识 图 谱 进 行 理解 ,推理 和 计算 。 目 前 ,百度 知识 图 谱 已 经 拥 
有 数 亿 实体 、. 数 千 亿 事实 ,并 已 广泛 应 用 于 百度 众多 产品 线 。 同 时 ,通过 构建 包括 业务 逻 
辑 和 行业 知识 库 在 内 的 行业 知识 图 谱 , 助 力行 业 升级 。 

1. 智能 问答 

在 智能 问答 领域 ,借助 知识 图 谱 问 答 技术 ,图 谱 问 答 搜索 产品 能 够 直接 回答 搜索 查询 
(query) 中 有 客观 答案 的 问题 ,如 刘德华 的 年 龄 、 上 善 若水 的 拼音 、 芒 衣 草 的 花期 等 。 答 案 
是 一 个 有 共同 特征 的 集合 问题 ,如 一 部 电视 剧 的 演员 表 ,形容 春天 的 成 语 、 清 朝 皇 帝 列 表 、 
李白 的 诗 等 。 

知识 推理 计算 能 力 是 根据 中 心 实体 的 属性 ,在 不 同 实体 的 同类 属性 以 及 同一 实体 的 
不 同属 性 之 间 通 过 推理 计算 等 方式 获得 比较 或 关联 的 答案 。 例 如 ,对 知识 图 谱 而 言 ,“ 今 
天 离 圣 诞 节 还 有 几 天 ”这 个 问题 ,不 是 一 个 静态 的 知识 ,无 法 把 这 个 问题 的 答案 直接 存在 
图 谱 里 ,而 是 需要 根据 今天 的 日 期 和 圣诞 节 的 日 期 推理 计算 得 到 一 个 正确 的 答案 。 如 果 
用 户 的 问题 是 “Zippo( 打 火 机 ) 能 不 能 带 上 飞机 ,通过 知识 图 谱 推理 可 以 直接 给 出 坐 飞机 
是 禁止 携带 zippo 的 ,如 图 2-35 所 示 。 
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2017 年 圣诞 节 | 倒计时 
zippo 可 以 带 上 飞机 吗 


距 今 还 有 39 天 ， 
2017 年 12 月 25 日 星期 一 各 目 现 和 掀 类 :zpo 
丁丁 年 ( 鸡 年 ) 冬 月 初 八 

法 律 依据 : 


中 国民 用 航空 局 相关 规定 


公历 12 月 25 日 是 圣诞 节 (Christmas) ， 又 称 " 耶 诈 
节 "， 西 方 传统 节日 。 公 历 12 月 24 日 是 平安 夜 (Silent 
Night) ， 即 圣 误 前 夕 。 

百度 知识 图 谱 报错 


百度 提示 您 : 此 内 容 是 系统 根据 相关 法 律 法 规 内 容 自动 生成 , 
仅 供 参 考 ， 建 议 咨询 专业 律师 或 相关 部 门 . 
百度 规章 








图 2-35 ”知识 推理 的 示例 


2. 实体 推荐 

用 户 在 发 起 一 次 搜索 时 ,满足 当前 的 需求 后 , 仍 有 可 能 存在 尚未 满足 的 潜在 需求 。 利 
用 知识 图 谱 中 实体 之 间 的 丰富 联系 .可 以 给 出 优质 的 推荐 ,激发 用 户 潜在 的 需求 。 根 据 查 
询 的 相关 性 、 用 户 点 击 推荐 内 容 的 可 能 性 等 多 方面 ,对 推荐 内 容 综 合 动 态 排序 ,向 用 户 展 
示 。 例 如 , 当 用 户 搜索 " 杨 宕 ”的 时 候 , 除 了 直接 给 出 和 杨 寡 有 关 的 各 个 维度 的 人 物 信 息 
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外 ,还 能 够 给 出 可 解释 的 推荐 理由 。 知 识 图 谱 还 有 生成 富 摘要 功能 , 即 借助 知识 图 谱 技术 
提炼 页 面 内 容 , 在 搜索 结果 中 展示 最 关键 的 内 容 与 服务 ,优化 搜索 体验 。 

3. 对 话 系统 

对 话 系统 能 与 用 户 进行 多 轮 交 互 。 首 先 ,用 户 的 输入 经 过 自然 语言 理解 模块 进入 对 
话 管理 系统 ,对 话 管理 系统 识别 出 当前 的 对 话 状态 ,并 确定 下 一 步 的 对 话 行为 。 对 话 策略 
模块 包含 通用 模型 和 领域 模型 。 前 者 负责 处 理 通用 的 交互 逻辑 ,后 者 处 理 特定 领域 的 交 
互 逻辑 。 之 后 ,该 系统 会 为 用 户 生成 交互 回复 ,其 中 后 台 的 答案 库 通过 知识 图 谱 构建 。 对 
话 系统 还 可 以 利用 知识 图 谱 丰 富 的 内 容 以 及 实体 的 不 同 侧面 ,通过 多 轮 交 互 澄清 用 户 的 
真实 意图 。 

4. 汉语 语言 知识 图 谱 

汉语 语言 博大 精深 ,百度 有 专门 针对 汉语 语言 的 知识 图 谱 。 例 如 ,搜索 “目的 笔顺 ”， 
知识 图 谱 可 以 直接 把 笔顺 反馈 给 用 户 。 针 对 现在 大 多 数 用 户 使 用 拼音 或 语音 输入 时 ,一 
些 字 不 会 念 ,无 法 输入 拼音 ,百度 会 把 汉字 拆 解 ,用 语言 描述 它 。 例 如 ,如 果 不 知道 “ 告 " 字 
怎么 念 ,就 可 以 这 样 提 问 :“ 上 面 是 “对 下面 是 “ 心 怎 么 念 ”"。 搜 索 结 果 页 除了 满足 用 户 
的 主 需求 外 ,还 有 很 多 与 这 个 汉字 有 关 的 扩展 内 容 , 如 拼音 、 释 义 、 组 词 、 近 反义词 成 语 、 
成 语 故 事 等 。 例 如 ,查询 “好 ” 字 的 多 音字 词组 ,知识 图 谱 列 出 的 内 容 如 图 2-36 所 示 。 
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图 2-36 汉语 语言 知识 图 谱 用 于 拆字 和 组 词 使 用 示例 


5. 智能 客服 

在 人 工 智能 技术 应 用 的 场景 中 ,服务 机 器 人 的 市 场 潜力 及 成 熟 度 是 最 高 的 。 据 高 德 
纳 (Gartner) 公 司 预 测 ,2020 年 智能 客服 将 取代 40% 的 传统 座席 。 以 电信 运营 商 为 例 , 传 
统 客服 每 天 要 处 理 大 量 简单 重复 的 用 户 需 求 , 耗 费 大 量 的 人 力 成 本 。 智 能 客服 的 出 现 能 
够 帮助 运营 商 解 决 这 个 问题 。 而 智能 客服 依靠 的 就 是 行业 知识 图 谱 的 构建 。 例 如 ,电信 
运营 商 的 流量 套餐 关联 的 是 日 流量 、 月 流量 、 流 量 包 等 信息 。 这 些 行 业 知 识 就 构建 了 电信 
运营 商 的 知识 图 谱 。 对 于 一 个 行业 来 说 ,除了 静态 的 实体 .属性 和 关系 外 ,还 有 业务 逻辑 。 
例如 ,拨打 运营 商 的 客服 电话 办 理 流 量 包 ,客服 会 询问 流量 包 的 类 型 。 用 户 选 择 了 其 中 一 
个 以 后 还 可 以 继续 查询 办 理 相 关 的 业务 ,这 是 一 个 完整 的 流程 。 这 个 流程 就 组 成 了 行业 
知识 图 谱 的 一 部 分 。 
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2.1 小 结 


逻辑 知识 表示 的 主要 特点 是 建立 在 某 种 形式 逻辑 的 基础 上 ,并 利用 了 逻辑 方法 研究 
推理 的 规律 , 即 条 件 和 结论 之 间 的 蕴涵 关系 。 光 辑 表 示 方 法 的 主要 优点 如 下 。 

(1) 严格 性 : 一 阶 谓词 逻辑 具有 完备 的 逻辑 推理 算法 ,可 以 保证 其 推理 过 程 和 结果 
的 正确 性 ,可 以 比较 精确 地 表达 知识 。 

(2) 通用 性 : 命题 逻辑 和 谓词 好 辑 是 通用 的 形式 逻辑 系统 ,具有 通用 的 知识 表示 方 
法 和 推理 规则 ,有 很 广泛 的 应 用 领域 。 

(3) 自然 性 : 命题 敢 辑 和 谓词 逻辑 是 采用 一 种 接近 自然 语言 的 形式 语言 表达 知识 并 
进行 推理 的 ,易于 被 人 接收 。 

(4) 明确 性 : 逻辑 表示 法 对 如 何 由 简单 陈述 句 构造 复杂 的 陈述 句 有 明确 的 规定 ,各 
个 语法 单元 (如 连接 词 . 量 词 等 ) 和 合式 公式 定义 严格 。 对 于 用 逮 辑 方法 表示 的 知识 ,可 以 
按照 一 种 标准 的 方法 进行 指派 ,因此 这 种 知识 表示 方法 明确 .易于 理解 。 

(5) 模块 性 : 在 逻辑 表示 法 中 ,各 条 知识 都 是 相互 独立 的 ,它们 之 间 不 直接 发 生 关 
系 , 便 于 知识 的 模块 化 表示 ,具有 易于 计算 机 实现 的 推理 算法 。 

但 是 ,逻辑 表示 方法 也 有 下 述 不 足 的 地 方 。 

(1) 效率 低 : 形式 推理 能 够 使 计算 机 在 不 知道 句子 指派 的 情况 下 得 到 有 效 的 结论 ， 
它 把 推理 演算 和 知识 的 含义 截然 分 开 , 抛 弃 了 表达 内 容 中 所 包含 的 语义 信息 ,往往 使 推理 
的 过 程 太 完 长 ,效率 低 。 在 推理 过 程 中 可 能 会 出 现 “ 组 合 爆炸 ”。 

(2) 灵活 性 差 ; 不 便于 表达 启发 式 知识 和 不 精确 的 知识 。 

为 了 能 够 表达 更 多 的 信息 ,在 谓词 迎 辑 中 已 经 引入 了 全 称 量词 和 存在 量词 ,但 仍然 有 
一 些 类 型 的 语句 无 法 表达 ,如 “大 多 数 同学 得 了 A”。 在 这 个 语句 中 ,量词 “大 多 数 ” 无 法 用 
存在 量词 和 全 称 量词 表达 。 为 了 表达 “大 多 数 ”, 一 种 好 辑 必 须 提供 一 些 用 于 计算 这 些 概 
念 的 谓词 ,如 第 5 章 将 要 介绍 的 模糊 逻辑 。 男 外 ,谓词 敢 辑 难于 表达 一 些 有 时 真 但 并 非 总 
真 的 事情 ,这 个 问题 也 可 以 通过 模糊 逻辑 解决 。 

经 典 迪 辑 推理 是 通过 运用 经 典 逻 辑 规则 ,从 已 知事 实 中 演绎 出 迎 辑 上 所 蕴涵 结论 的 
过 程 。 按 演绎 方法 的 不 同 ,可 以 分 为 两 大 类 : 归结 演绎 推理 和 非 归 结 演绎 推理 。 本 章 主 
要 介绍 了 归结 演绎 推理 。 通 过 引入 新 的 推理 规则 一 一 归结 推理 规则 ,介绍 了 基于 该 规则 
的 归结 演绎 推理 过 程 。 

本 章 还 介绍 了 知识 表示 的 其 他 方法 一 一 产生 式 系统 ,框架 .语义 网 络 .脚本 和 知识 图 
谱 表示 ,前 3 种 知识 表示 都 是 以 一 阶 逻 辑 表示 为 基础 的 ,它们 都 可 以 转变 为 等 价 的 一 阶 敢 
辑 表 示 。 所 以 ,逻辑 是 知识 表示 的 基本 手段 ,构成 了 人 工 智 能 研究 的 基础 。 语 义 网 络 、 杠 
架 、 脚 本 和 知识 图 谱 表 示 方 法 是 有 代表 性 的 结构 化 知识 表示 方法 。 本 章 最 后 对 基于 知识 
的 系统 所 涉及 的 问题 一 一 知识 获取 、 知 识 组 织 和 知识 应 用 进行 了 论述 。 


习题 


2.1 验证 下 列 公 式 为 永 真 式 ,其 中 A.B,C 为 语法 变 元 ,表示 任意 公式 。 
Tt VA 
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T2. A>(B—>A) 
T3. A>(AVB),B—>(AVB) 
T4. (AAB)—>A,(AAB)—B 
T5. (AA(AAB))—>B 
T6. (A—>B)A(B—>0)—>(A—>C) 
T7. (A—>(B>0))—>((A—>B)—>(A—C)) 
T8. -(-A) >A 
T9. AVAeA,AAAeA 
T10. AVBe>BVA 
AAB<BAA 
T11. AACBVC)(AAB)V(AAC) 
(BVOAA®(BAA)V CAA) 
T12. AV (BAOmAVB)A(AVO) 
(BAC)IVA(BVA)ACCVA) 
T13. "(AVB)e-AAnB 
T14. AV(AAB)A,AA(CAVB) =A 
T15. (A>B)+>(-AVB) 
T16. (4A 一 (B 一 C))e((AAB) 一 C) 
T17. (A—>B)+(-B>-A) 
T18. (AmB)+» (A—>B) A (B—A) 
TI19. (A®B)E(ANB)V (AA -—B) 
T20. AVTeT,AATeA, AVFeA,AAFeF 
证 明 : 对 任 一 命题 公式 p 可 导出 它 的 合 取 ( 析 取 ) 范 式 。 
证 明 : A 一 A 是 PC 的 定理 。 
证 明 A 是 {一 一 A}) 的 演绎 结果 , 即 证 明了 A rc A。 
谓词 好 辑 和 命题 逮 辑 有 什么 异同 ? 
什么 是 谓词 的 项 ? 什么 是 谓词 的 阶 ? 
我 们 已 经 知道 真 值 表 可 以 验证 复杂 句子 的 正确 性 ,请 说 明 怎样 根据 真 值 表 确定 一 个 
句子 是 有 效 的 、 可 满足 的 和 不 可 满足 的 。 
怎样 用 真 值 表 的 方法 验证 假 言 推理 是 正确 的 ? 即 P,P>Q=>Q。 
我 们 已 经 定义 了 4 个 不 同 的 二 元 逻辑 联结 词 ,还 有 其 他 的 二 元 联结 词 吗 ? 有 多 
Lg 
考虑 一 个 世界 中 只 有 4 个 命题 A、.B、C 和 DD。 对 于 下 面 的 3 个 句子 ,各 有 多 少 个 
模型 (解释 ) 使 之 为 真 ? 
Ca) AVB (b) AAB (co AABAC 
用 谓词 逻辑 公式 表示 如 下 自然 数 公理 。 
(1) 每 个 数 都 存在 一 个 且 仅 存在 一 个 直接 后 继 数 。 
(2) 每 个 数 都 不 以 0 为 直接 后 继 数 。 
(3) 每 个 不 同 于 0 的 数 都 存在 一 个 且 仅 存 在 一 个 直接 前 驱 数 。 
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2.12 用 一 阶 谓词 逻辑 表示 下 面 的 句子 (自己 定义 合适 的 谓词 ) 。 


护 芭 


>on 


和 


21 


(1) 人 人 为 我 ,我 为 人 人 。 
(2) 鱼 我 所 欲 也 ,能 掌 亦 我 所 和 欲 也 。 
(3) 不 存在 一 个 最 大 的 素数 。 
(4) 任意 一 个 实数 都 有 比 它 大 的 整数 。 
(5) 并 不 是 所 有 的 学 生 都 选修 了 历史 和 生物 。 
(6) 历史 考试 中 只 有 一 个 学 生 不 及 格 。 
(7) 只 有 一 个 学 生 历 史 和 生物 考试 都 不 及 格 。 
(8) 历史 考试 的 最 高 分 比 生 物 考 试 的 最 高 分 要 高 。 
(9) 我 们 都 生活 在 一 个 黄色 的 房子 里 。 
(10) 星期 六 ,所 有 的 学 生 或 者 去 参加 舞会 了 ,或 者 工作 去 了 ,但 是 没有 两 者 都 
去 的 。 
(11) 只 有 两 个 学 生 去 参加 了 舞会 。 
(12) 每 个 力 都 存在 一 个 大 小 相等 .方向 相反 的 反作用 力 。 
写 出 一 个 谓词 演算 子 句 ,在 该 子 句 为 真 的 世界 中 , 仅 包含 一 个 对 象 。 
Hanoi 问题 表示 : 已 知 3 个 柱子 1、2、3,3 个 盘子 A、B.C(A 比 B 大 ,B 比 C 大 )。 
初始 状态 时 ,A、B、C 依次 放 在 柱子 1 上 。 目 标 状态 是 A、B、C 依次 放 在 柱子 3 上 。 
条 件 是 每 次 可 移动 一 个 盘子 ,盘子 上 方 为 空 才 可 以 移动 ,而且 任何 时 候 都 不 允许 大 
盘子 在 小 盘子 的 上 面 。 请 使 用 一 阶 谓词 旭 辑 对 这 一 问题 进行 描述 。 
请 求 出 公式 PC(PAQ) 的 析 取 范式 和 合 取 范 式 。 
将 下 列 公式 化 为 前 束 范式 。 
(1) VzP(Cz)A3 了 xyQCy) 
(2) VzVy(3z(CPCzrz) 人 ARC,z)) 一 了 了 xQCzyyyz)) 
设 个 体 域 为 D=={1,2}) ,给 出 下 述 公 式 在 D 上 的 一 种 或 多 种 指派 ,并 指出 每 一 种 指 
派 下 各 公式 的 真 值 。 
(I 32NPLUFCR) Q(z fa))) 
(2) (Jz)(P(r)AQ(r,a)) 
(3) (Yz)(3y)CPCz)AQCzy)) 
命题 巡 辑 和 谓词 逻辑 的 归结 过 程 有 什么 不 同 ? 证 明 命题 逻辑 的 归结 推理 规则 ,并 
论述 归结 推理 规则 是 否 完备 ? 
什么 是 完备 的 归结 策略 ? 哪些 规则 策略 是 完备 的 ? 
考虑 下 面 不 可 满足 的 子 句 集合 
PVQ,PVn”Q,”PVvVQ,”PV ”Q 
(1) 对 下 面 每 一 种 策略 求 其 归结 反驳 。 
(a) 支持 集 策略 (其 中 支持 集 是 上 述 子 句 列表 的 最 后 一 个 子 句 )。 
(b) 祖先 过 滤 策 略 。 
(c) 一 种 既 违反 支持 集 ,也 违反 祖先 过 滤 的 策略 。 
(2) 说 明 不 存在 上 述 不 可 满足 的 子 句 集合 的 线性 输入 归结 反驳 。 
假设 G 是 一 阶 谓词 公式 ,举例 说 明 : G 和 G 的 Skolem 标准 型 并 不 等 价 ,并 解释 为 
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什么 在 不 可 满足 的 意义 下 是 等 价 的 。 

为 什么 要 将 合式 公式 化 为 子 句 集 ? 在 合式 公式 化 为 子 句 集 的 过 程 中 ,为 什么 需要 
通过 换 名 使 所 有 的 量词 的 约束 变量 不 同名 ? 

谓词 公式 和 它 的 子 句 集 等 价 吗 ? 在 什么 情况 下 它们 才 等 价 ? 

把 下 面 的 表达 式 转换 成 子 句 形式 : 

(1) ((3z)P(z)V(3z)Qcz)) 一 (3z)LPCz)VQCz)] 

(2) (Vz)PCz) 一 (3z)[CVz)QCz,z)VCVz)RCzryyyz)] 

(3) (VOLP OV WIVOIQ Czy 7 YR, yz)]] 

判断 下 列表 达 式 对 是 否 可 以 合 一 ,如 果 可 以 合 一 ,请 给 出 mgu。 

(1) P(x,6,6),P(a,y,z) 

(2) P(xz, f(zx)),P(y,y) 

(3) 2 十 3 一 z,z 一 3 十 3 

在 谓词 逻辑 的 归结 推理 过 程 中 ,为 什么 要 做 变量 置换 和 合 一 处 理 ? 在 合 一 过 程 中 ， 
为 什么 要 求 出 差异 集 ? 在 怎样 的 情况 下 ,可 以 从 差异 集 知道 两 个 子 句 不 可 合 一 ? 
对 下 述 公式 集合 执行 合 一 算法 ,判断 是 否 可 合 一 ,如 果 可 以 合 一 ,请 给 出 最 一 般 
合 一 。 

(1) S={P(a,z,f(g(y))),P(z,h(z,u), f(u))} 

(2) S={P(f(a),g(s)),P(y,y))} 

(3) S={P(a,z,h(g(z))), Pl(z,h(y),h(y))} 

什么 样 的 子 句 可 以 做 归结 ? 为 什么 归结 式 是 母 式 ( 用 于 归结 的 子 句 ) 的 逻辑 推论 ? 
为 什么 说 归结 出 空子 句 就 可 以 判定 子 句 集 不 可 满足 ? 

子 句 PVQVR, 了 PV "QVS 是 否 可 以 归结 ? 如 果 不 能 归结 ,为 什么 ”如 果 可 以 
归结 ,为 什么 SVR 不 是 其 归结 式 ? 

求证 G 是 Fi 和 F 的 逻辑 推论 。 

Fi: (Vr)(P(r)>(Vy)(Q(y) > -LL(r,y))) 

F:( 了 z)(CPCz)ACVy)CRC) 一 LCzy))) 

G:(Vz)CRCGz) 一 QCzr)) 

已 知 : 

规则 1: 任何 人 的 兄弟 不 是 女性 

规则 2: 任何 人 的 姐妹 必 是 女性 

事实 : Mary 是 Bill 的 姐妹 

求证 : 用 归结 推理 方法 证 明 Mary 不 是 Tom 的 兄弟 。 

考虑 下 面 的 句子 

。 每 个 程序 都 存在 bug 

”含有 bug 的 程序 无 法 工作 

。P 是 一 个 程序 

(1) 用 一 阶 谓词 逻辑 表示 上 述 句 子 。 

(2) 使 用 归结 原理 证 明 P 不 能 工作 。 

用 归结 法 证 明 A, 人 As 人 As 一 B。 
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其 中 ,Al 二 Vx((P(z) A "Q(z) > IyW(lr,y) AV(Y))) 

A:s= 3Izxz{P(r)AUC(r)A Vy (Wr,y >U(y))} 

A: 一 ”了 z(QCz)AUCz)) 

B 王 了 3z(CVCz)AUCz)) 
函数 cons(z，,y) 表 示 把 元 素 zx 插 在 列表 y 的 头 部 形成 的 列表 。 我 们 用 Nil 表示 空 
列表 ,列表 (2) 由 cons(2,Nil) 表 示 ; 列 表 (1,2) 由 cons(1,cons(2,Nil)) 表 示 ; 等 等 。 
公式 Last(L,e) 指 e 是 列表 L 的 最 后 一 个 元 素 。 有 下 面 的 公理 : 
。 (Vu)[Last(cons(u, Nil),u)] 
®。° (VxrVyVz)[Last(y,z)—>Last(cons(x,y),z)] 
(1) 根据 这 些 公理 用 归结 反 驶 证 明 : 

(Iv)[Last(cons(2,cons(1,Nil)),v)] 

(2) 用 答案 提取 方法 找到 v, 它 是 列表 (2,1) 的 最 后 一 个 元 素 。 
用 谓词 逻辑 的 子 句 集 表 示 下 述 刑侦 知识 ,并 用 反 演 归结 的 支持 集 策略 证 明 结 论 。 
(1) 用 子 句 集 表示 下 述 知识 。 
Q@ John 是 贼 ; 
@ Paul 喜欢 酒 (wine); 
@ Paul( 也 ) 喜 欢 奶 酪 (cheese) ; 
@ 如 果 Paul 喜欢 某 物 , 则 John 也 喜欢 ; 
@@ 如 果 某 人 是 贼 ,而 且 喜 欢 某 物 , 则 他 就 可 能 会 偷 穷 该 物 。 
(2) 求 : John 可 能 会 偷窃 什么 ? 
理解 瑟 域 .谓词 公式 五 域 上 的 原子 集 以 及 互 域 上 的 解释 。 如 何 构造 九 域 ?如 何 
构造 互 域 上 解释 的 语义 树 ?为 什么 封闭 语义 树 意味 着 相应 的 子 句 集 不 可 满足 ? 
什么 是 子 句 集 在 D 域 上 的 解释 ? 什么 是 子 句 集 在 五 域 上 的 解释 ? 它们 之 间 有 什 
么 关系 ? 
给 定 下 面 一 段 话 : 
Tony、Mike 和 John 都 是 Alpine Club 的 会 员 。 每 个 会 员 或 者 是 一 个 滑雪 爱好 者 ， 
或 者 是 一 个 登山 爱好 者 ,或 者 都 是 。 没 有 一 个 登山 爱好 者 喜欢 下 雨 ,所 有 的 滑雪 爱 
好 者 都 喜欢 雪 。Tony 喜欢 的 所 有 东西 Mike 都 不 喜欢 ,Tony 不 喜欢 的 所 有 东西 
Mike 都 喜欢 。Tony 喜欢 十 和 雪 。 
用 谓词 演算 表达 上 述 信息 。 把 问题 “ 谁 是 该 俱乐部 的 会 员 , 他 是 一 个 登山 爱好 者 ， 
但 不 是 滑雪 爱好 者 ”表达 为 一 个 谓词 表达 式 , 用 归结 反驳 提取 答案 。 
任何 通过 了 历史 考试 并 中 了 彩票 的 人 都 是 快乐 的 。 任 何 肯 学 习 或 幸运 的 人 都 可 以 
通过 所 有 考试 ,小 张 不 学 习 , 但 很 幸运 ,任何 人 只 要 是 幸运 的 ,就 能 中 彩 。 
求证 : 小 张 是 快乐 的 。 
已 知 有 些 人 喜欢 所 有 的 花 ,没有 任何 人 喜欢 任意 的 杂 草 ,证 明 花 不 是 杂 草 。 
已 知 : 海关 职员 检查 每 一 个 人 境 的 不 重要 人 物 , 某 些 贩 毒 者 人 境 , 并 且 仅 受到 贩毒 
者 的 检查 ,没有 一 个 贩毒 者 是 重要 人 物 。 
证 明 : 海关 职员 中 有 贩毒 者 。 
N=3、A 委 3 时 ,对 传教 士 -野人 问题 的 产生 式 系统 各 组 成 部 分 进行 描述 (给 出 综合 
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数据 库 .规则 集合 的 形式 化 描述 ,给 出 初始 状态 和 目标 条 件 的 描述 ) ,并 画 出 状态 空 
间 图 。 

对 量 水 问题 给 出 产生 式 系统 描述 ,并 画 出 状态 空间 图 。 

有 两 个 无 刻度 标志 的 水 壶 ,分 别 可 装 5L 和 2L 的 水 。 设 男 有 一 水 饶 , 可 用 来 向 水 
壶 灌水 或 倒 出 水 ,两 个 水 壹 之 间 ,水 也 可 以 相互 倾 灌 。 已 知 5L 过 为 满 过 ,2L 壶 为 
空 壶 , 问 如 何 通过 倒 水 或 灌水 操作 ,使 能 在 2L 的 壶 中 量 出 1L 的 水 。 

对 汉 诺 塔 问题 给 出 产生 式 系统 描述 ,并 讨论 N 为 任意 时 状态 空间 的 规模 。 
相传 古代 一 庙宇 中 有 3 根 立 柱 ,柱子 上 可 套 放 直 径 不 等 的 N 个 圆 盘 , 开 始 时 所 有 
圆 盘 都 放 在 第 一 根 柱子 上 , 且 小 盘 处 在 大 盘 之 上 , 即 从 下 向 上 直径 是 递减 的 。 和 尚 
们 的 任务 是 把 所 有 圆 盘 一 次 一 个 地 搬 到 另 一 个 柱子 上 去 (不 许 暂 搁 地 上 等 ), 且 只 
许 小 盘 在 大 盘 之 上 。 问 和 尚 们 如 何 搬 最 后 能 将 所 有 的 盘子 都 操 到 第 三 根 柱 子 上 
(可 以 使 用 任 一 根 柱子 作 过 渡 )。 

N=2 时 ,求解 该 问题 的 产生 式 系 统 描述 ,给 出 其 状态 空间 图 。 讨 论 N 为 任意 值 
对 猴子 摘 香 燕 问题 ,给 出 产生 式 系统 描述 。 

一 个 房间 里 ,天 花 板 上 挂 有 一 串 香 苞 , 有 一 只 猴子 可 在 房间 里 任意 活动 (到 处 走动 ， 
推移 箱子 ,攀登 箱子 等 ) 。 设 房间 里 还 有 一 只 可 被 猴子 移动 的 箱子 , 且 猴 子 登 上 箱 
子 时 才能 摘 到 香蕉 , 问 猴子 在 某 一 状态 下 ( 设 猴子 位 置 为 a, 箱子 位 置 为 5, 香 奉 位 
置 为 c) 如 何 行动 可 摘 取 到 香花 。 

对 3 枚 钱币 问题 给 出 产生 式 系统 描述 及 状态 空间 图 。 

设 有 3 枚 钱币 ,其 排列 处 在 “ 正 、 正 、 反 ”状态 , 现 允许 每 次 可 翻动 其 中 任意 一 个 钱 
币 , 问 只 许 操作 3 次 的 情况 下 ,如 何 翻 动 钱 币 使 其 变 成 * 正 、 正 、 正 ”或 “ 反 、 反 、 反 ” 
说 明 怎样 才能 用 一 个 产生 式 系 统 把 十 进 制 数 转换 为 二 进 制 数 ,并 通过 转换 141. 125 
这 个 数 为 二 进 制 数 , 曾 明 其 运行 过 程 。 

设 可 交换 产生 式 系统 的 一 条 规则 R 可 应 用 于 综合 数据 库 D 生成 出 D', 试 证 明 车 
R 存在 逆 , 则 可 应 用 于 D' 的 规则 集 等 同 于 可 应 用 于 DD 的 规则 集 。 

用 语义 网 络 表示 下 列 知识 。 

(1) 我 是 一 个 人 。 

(2) 我 拥有 我 的 计算 机 。 

(3) 我 的 计算 机 的 拥有 者 是 我 。 

(4) 我 的 计算 机 是 英特尔 奔腾 5 。 

(5) 英特尔 奔腾 5 是 微机 。 

(6) 微机 是 计算 机 。 

(7) 英特尔 奔腾 5 包括 硬盘 、 显 示 器 、 微 处 理 器 、 内 存 。 

(8) 硬盘 、 显 示 器 、 微 处 理 器 内存 是 英特尔 奔腾 5 的 组 成 部 分 。 

用 语义 网 络 表 示 下 列 命题 。 

(1) 树 和 草 都 是 植物 。 

(2) 树 和 草 都 有 根 、 有 叶 。 
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(3) 水 草 是 草 , 且 长 在 水 中 。 

(4) 果树 是 树 , 且 会 结果 。 

(5) 苹果 树 是 果树 中 的 一 种 , 它 结 苹果 。 

用 语义 网 络 分 别 表示 下 列 命题 。 

(1) 如 果 车 库 起 火 ,那么 用 二 氧化 碳 或 沙 扑 灭 。 

(2) 所 有 的 学 生 都 用 计算 机 算 题 。 

用 框架 表示 下 述 报道 的 风灾 事件 。 

【虚拟 新 华 社 9 月 16 日 电 了 国家 气象 局 命名 的 “2017 梅花 ”台风 于 昨日 下 午 4 时 在 
浙江 舟山 地 区 登陆 。 据 专家 经 验 ,认为 风力 大 于 等 于 8 级 。 但 风力 中 心 的 准确 值 ， 
有 待 数据 处 理 , 目 前 尚未 发 布 。 此 次 台风 造成 的 损失 , 若 需 要 详细 的 损失 数字 ,可 
电 询 自然 灾害 统计 中 心 。 另 据 国 家 气象 局 介绍 说 ,事前 曾 得 到 国际 气象 组 织 的 预 
报 : 昨日 上 午 于 太平 洋 赤道 地 区 生成 高 压气 旋 , 将 向 北 移动 ,于 浙江 登陆 。 依 据 国 
际 惯例 将 其 命名 为 “Carla” 恨 风 , 我 国 也 予以 承认 。 至 于 “Carla” 是 否 就 是 登陆 的 
“2017 梅花 ”, 尚 需 男 外 加 以 核查 。 

(提示 : 分 析 、 概 括 用 下 夯 线 标 出 的 要 点 ,经 过 概念 化 形成 槽 (slot)、 侧 面 (facet) 值 。 
特别 要 注意 ,“ 值 ”(value)、“ 上 默认 值 ”(default)、“ 如 果 需 要 值 ”(if-needed)、“ 如 果 附 
加 值 ”Gif-added) 的 区 别 与 应 用 ,建议 采用 如 下 格式 ,不 用 的 侧面 值 可 删 去 。) 


Frame 台风 : 

















Slotl: Slot2: Slot3: 
Value: Value: Value: 
Default: Default: Default: 
If-needed: If-needed: If-needed: 
If-added: ITf-added: If-added: 


用 框架 系统 描述 旅馆 房间 的 概念 ,包括 房间 结构 和 基本 设施 两 方面 。 房 间 结构 包 
括 墙壁 门 的 数量 .地 面 的 材料 和 颜色 ;基本 设施 包括 椅子 .电话 .与 床 有 关 的 内 容 ， 
对 于 床 , 还 需 特别 说 明 关 于 垫子 的 有 关内 容 。 

语义 网 络 .框架 系统 和 知识 图 谱 的 知识 表示 的 要 点 是 什么 ?” 它们 有 何 联系 和 区 别 ? 
阐述 知识 获取 、 知 识 组 织 和 知识 应 用 的 过 程 。 

(思考 题 ) 证 明 八 数码 问题 的 所 有 状态 可 划分 为 两 个 不 相交 的 子 集 ,处 在 同一 个 子 
集中 的 状态 之 间 可 以 相互 到 达 , 处 在 不 同 子 集中 的 两 个 状态 之 间 必 不 可 达 。 设 计 
一 个 算法 判断 一 个 给 定 的 状态 属于 哪个 子 集 , 并 解释 为 什么 这 对 于 生成 随机 状态 
是 有 用 的 。 

(思考 题 ) 写 出 描述 谓词 GrandChild、GreatGrandparent、 Ancestor、 Brother、 
Sister, Daughter\Son FirstCousin、BrotherInLaw SisterInLaw\、Aunt 和 Uncle 的 
公理 。 找 出 隔 了 nn 代 的 第 m 代 姑 表亲 的 合适 定义 ,并 用 一 阶 逻辑 写 出 该 定义 。 现 
在 写 出 图 2-37 所 示 的 家 族 树 的 基本 事实 。 采 用 适当 的 逻辑 推理 系统 ,把 你 已 经 写 
出 的 所 有 语句 告诉 系统 ,并 问 系统 : 谁 是 Elizabeth 的 孙 辈 , 谁 是 Diana 的 姐夫 / 妹 
夫 , 谁 是 Zara 的 曾祖 父母 和 谁 是 Eugenie 的 祖先 ? 

(思考 题 ) 查 找 资料 ,撰写 关于 知识 图 谱 的 建立 技术 的 小 论文 。 
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图 2-37 典型 家 族 树 
(符号 加 连接 配偶 ,箭头 指向 孩子 


在 机 器 中 存储 了 上 亿 条 实体 知识 ,这 对 于 机 器 来 说 不 是 难事 ,困难 在 于 存储 实体 的 
关系 上 。 一 个 实体 对 应 多 个 属性 ,如 一 张 桌子 对 应 了 品牌 .颜色 .木材 等 属性 ,这 些 
属性 就 有 上 百 亿 级 别 ,这 些 关 系 错综复杂 地 整合 起 来 ,要 存储 的 数据 就 会 指数 级 增 
加 ,这 注定 是 一 张 超级 的 海量 级 图 谱 。 

下 面 以 “奢侈 品牌 路 易 威 登 1854 年 成 立法 国 巴黎 ”为 例 , 说 明 如 何 建立 图 谱 。 下 面 
先 说 明 机 器 如 何 存储 知识 。 

(1) 奢侈 品 与 路 易 威 登 ( 识 别 出 路 易 威 登 是 个 品牌 并 且 是 奢侈 品 ,存储 该 知识 ) 。 
(2) 路 易 威 登 与 1854 年 成 立 ( 识 别 出 路 易 威 登 的 成 立时 间 ,存储 该 知识 ) 。 

(3) 路 易 威 登 成 立 于 法 国 巴 黎 ( 识 别 出 路 易 威 登 成 立 于 法 国 , 存 储 该 知识 ) 。 

(4) 法 国 巴黎 (识别 出 法 国 与 巴黎 有 关系 ,存储 该 知识 ) 。 


以 上 只 是 一 种 粗略 的 理想 化 的 情景 。 实 际 上 ,这 种 知识 图 谱 是 动态 的 ,有 不 断 增 
加 、 删 减 的 过 程 ,每 个 语句 中 的 知识 都 是 按照 时 间 线 出 现 的 大 数据 关键 词 内 容 根 据 
统计 后 才 建 立 起 来 的 知识 图 谱 , 与 人 脑 一 样 ,这 些 关系 知识 图 谱 可 能 出 现 之 后 又 消 
失 , 最 后 那些 确凿 无 疑 的 关系 被 留 了 下 来 ,但 是 这 些 依 然 是 动态 的 ,如 果 哪 天 法 国 
的 首都 不 再 是 巴黎 ,整个 关系 知识 图 谱 数据 库 就 会 将 所 有 数据 全 部 更 新 。 

(思考 题 ) 写 出 一 系列 逻辑 谓词 ,这些 谓词 将 完成 简单 的 汽车 故障 诊断 (例如 ,如 果 
发 动机 熄火 ,车 灯 不 亮 , 那 么 电池 就 有 问题 ) 。 不 必 过 于 烦琐 ,只 需要 包括 以 下 几 种 
情况 : 电池 问题 . 油 用 完了 火花 塞 坏 了 、 发 动机 启动 器 坏 了 。 

(思考 题 ) 编 程 求解 水 过 问题。 给 定 4L 和 3L 的 水 壶 各 一 个 ,水 壶 上 没有 刻度 ,可 
以 向 水 壹 中 加 水 。 如 何在 4L 的 壶 中 准确 地 得 到 2L 水? 

(思考 题 ) 编 程 求 解 合 一 算法 。 文 字 LI1 和 L2 如 果 经 过 执行 某 个 置换 ;, 满 足 L1s 二 
工 2s, 则 称 工 1 与 L2 可 合 一 ,* 称 为 其 合 一 元 。 本 程序 可 判断 任意 两 个 文字 能 否 合 
一 , 若 能 合 一 , 则 给 出 其 合 一 元 。 合 一 算法 程序 运行 界面 示例 如 图 2-38 所 示 。 
(思考 题 ) 对 以 下 问题 给 出 完整 的 形式 化 。 选 择 的 形式 化 方法 要 足够 精确 ,以 便于 
实现 。 


T 
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图 2-38 合 一 算法 程序 运行 界面 示例 


(1) 只 用 4 种 颜色 对 平面 地 图 着 色 ,要 求 每 两 个 相 邻 的 地 区 不 能 具有 相同 的 颜色 。 

(2) 屋子 里 有 只 3 英尺 (1 英尺 二 0. 3048 米 ) 高 的 猴子 , 离 地 8 英尺 的 屋顶 上 挂 着 
一 串 香花 。 猴 子 想 吃香 菩 。 屋 子 里 有 两 个 可 冯 放 、 可 移动 、 可 梦 息 的 3 英尺 高 
的 箱子 。 

2.63 (思考 题 ) 编 程 求解 九宫 图 。 在 3X3 组 成 的 九宫 格 棋盘 上 摆 有 8 个 将 牌 ,每 一 个 将 

牌 都 刻 有 1 一 8 中 的 某 一 个 数码 。 棋 盘 中 留 有 一 个 空格 ,允许 其 周围 的 某 一 个 将 牌 

向 空格 移动 ,这 样 ,通过 移动 将 牌 ,就 可 以 不 断 改变 将 牌 的 布局 。 

给 定 一 种 初始 的 将 牌 布局 ( 称 初始 状态 ) 和 一 个 目标 布局 ( 称 目标 状态 ) ,如 何 移动 

将 牌 ,实现 从 初始 状态 到 目标 状态 的 转变 。 问 题 的 解答 也 就 是 给 出 一 个 合法 的 走 

步 序列 。 九 宫 图 程序 运行 界面 示例 如 图 2-39 所 示 。 





人 工 智能 演示 程序 之 八 数码 问题 
Dele 0 





初始 状态 目标 状态 
DYE O00 
T+0O00 
DAO 000 


ED | | 


这 程式 方法 | 寓 席 优先 | 癌变 | 及 佳人 先 | A 革 法 | 


_ 珊 | 

下 = 步 

播放 | 万。 步 必 
ea | 

















图 2-39 九宫 图 程序 运行 界面 示例 


2.64 (思考 题 ) 归 类 测试 算法 。 归 类 : 对 子 句 志和 M , 若 存在 一 个 代 换 ,使 得 L 为 M 
的 一 个 子 集 , 则 工 将 M 归 类 。 
归 类 测试 的 目的 是 判断 两 个 子 句 间 是 否 有 归 类 关系 ,如 果 有 ,在 推理 过 程 中 应 该 将 
被 归 类 的 子 句 删除 ,以 提高 推理 效率 。 


2. 66 


2.67 
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要 求 : (1) 待 测试 的 子 句 必须 是 规范 化 的 ; (2) 谓 词 项 中 首 字母 大 写 的 为 常量 ,小 
写 的 为 变量 ,函数 名 首 字母 应 该 为 小 写 ; (3) 最 好 不 要 在 两 个 子 句 中 出 现 同一 个 变 
元 ,虽然 出 现 相 同 的 变 元 不 会 影响 最 终 的 结果 ,但 得 到 的 代 换 却 有 可 能 不 正确 ; 
(4) 单 击 “V” 符 号 可 在 子 句 中 加 入 析 取 符 ; (5) 得 到 的 实现 归 类 的 代 换 并 非 为 最 一 
般 合 一 元 ,这 是 因为 根据 归 类 的 定义 ,只 需 存在 一 个 代 换 ,使 得 Ls 成 为 M 的 一 个 
子 集 即 可 。 

(思考 题 ) 编 程 求解 传教 士 - 野 人 问题 。 有 N 个 传教 士 和 NN 个 野人 要 过 河 , 现 在 有 
一 条 船只 能 承载 K 个 人 (包括 野人 ),K 二 N, 在 任何 时 刻 , 如 果 有 野人 和 传教 土 在 
一 起 ,必须 要 求 传教 士 的 人 数 多 于 或 等 于 野人 的 人 数 。 传 教士 -野人 问题 程序 运 
行 界面 示例 如 图 2-40 所 示 。 


传教 士 和 野人 过 河 程 序 
哲人 双 ) 谊 未 深 公 香 ) 帮助 0p 














图 2-40 传教 士 -野人 问题 程序 运行 界面 示例 


(思考 题 ) 魔 方 是 由 一 些小 方块 联结 在 一 起 的 一 个 大 立方 体 。 大 立方 体 6 个 面 ,每 

个 面 由 9 个 小 方 格 组 成 。 小 立方 块 分 为 3 种 类 型 :“ 角 块 ”露出 3 个 面 ,“ 边 块 " 露 

出 方 格 的 两 个 面 ,“ 中 心 块 ”露出 方 格 的 一 个 面 。 一 个 魔方 共有 8 个 角 块 ,12 个 边 

块 ,6 个 中 心 块 。 

要 求 : (1) 开 发 一 程序 ,通过 键盘 和 鼠标 打 乱 魔方 (图 2-41、 图 2-42) 及 恢复 魔方 

(图 2-43); (2) 按 一 定 步骤 自动 还 原 魔方 【提示 参 见 参 考 文献 L[11,12]】 
(思考 题 ) 奥 木 是 中 国 一 种 传统 的 立体 拼装 玩具 ,民间 也 称 为 “六 合 连 近 太极 架 ”( 如 
图 2-44 和 图 2-45 所 示 ) ,相传 是 我 国 工 匠 大 师 鲁 班 为 教徒 弟 所 制 , 其 组 合 方法 是 由 
六 根 形状 各 异 的 类 长 方 体 木 条 拼装 成 一 个 立体 交叉 的 正 十 字形 ,而 该 形状 表面 却 看 
不 出 是 由 多 根木 条 组 合 而 成 ,中 国 古 建筑 中 采用 的 六 合 结 构 甚 至 可 以 不 用 钉子 等 工 
具 进 行 固定 ,所 采用 的 便 是 奥 木 结构 。 奥 木 设 计 巧 妙 ,拼装 有 着 较 强 的 技巧 性 。 
通过 先 搜 索 目 标 状态 ,后 进行 拆 解 的 途径 进行 求解 ,求解 所 有 的 奥 木 组 合 方式 ,并 进 
行 计算 机 程序 图 形 演示 (图 2-46) 。【 提 示 参 见 参 考 文献 [13,14]】 








122 人 -和 能 ( 营 3 虎 ) 





移 电 对 


图 2-41 通过 鼠标 打 乱 魔方 图 2-42 打 乱 后 的 魔方 图 2-43 恢复 魔方 





图 2-44 奥 木 图 2-45 ”演示 中 的 奥 木 


= 晤 


图 2-46 奥 木 的 构件 及 组 装 场景 


第 3 章 
搜索 技术 


搜索 技术 是 一 种 通用 的 问题 求解 技术 ,一 直 是 人 工 智 能 的 核心 研究 领 
域 。 它 通常 是 先 将 待 解 问题 转化 为 某 种 可 搜索 的 “问题 空间 ”(problem 
spaces) ,然后 在 该 空间 中 寻找 解 。 问 题 空间 通常 由 于 规模 巨大 不 适 于 采用 
显 式 的 枚 举 表示 ,而 采用 隐 式 的 形式 化 问题 模型 。 不 同类 型 的 问题 可 表示 为 
状态 空间 (state spaces) 方案 空间 (solution spaces) 等 不 同类 型 的 空间 ,因而 
需要 不 同 的 方法 予以 形式 化 。 不 同类 型 的 问题 空间 因 结 点 Cnodes) 和 弧 
Carcs) 的 含义 不 同 也 需要 相 适 应 的 搜索 算法 。 

本 章 将 主要 介绍 基于 状态 空间 的 搜索 技术 。 此 类 技术 的 共同 特点 是 : 
使 机 器 人 (Agent`\ 智 能 代理 ) 在 采取 行动 之 前 ,以 达成 某 目 标 状 态 为 目的 ,在 
状态 空间 上 搜索 得 出 从 初始 状态 可 达到 目标 状态 的 “动作 序列 ”。 注 意 ,搜索 
技术 是 机 器 人 在 思考 阶段 的 一 种 技术 。 当 然 , 这 种 思考 在 实际 问题 上 的 适用 
性 也 取决 于 两 个 方面 : 问题 模型 的 适用 性 、 搜 索 算 法 的 适用 性 。 对 于 较 复 杂 
的 实际 问题 ,采用 过 于 简单 .抽象 的 问题 模型 或 许 导致 搜索 得 出 的 方案 不 可 
用 。 对 于 新 的 问题 模型 ,以 往 的 搜索 算法 也 很 可 能 无 法 得 出 最 优 方案 。 

本 章 介 绍 3 种 重要 的 状态 空间 上 的 通用 型 搜索 技术 。 第 一 种 状态 空间 
常用 于 建 模 单方 面 行 动 问题 ,第 二 种 状态 空间 (AND-OR 图 ) 常 用 于 建 模 复 
杂 问 题 的 分 解 , 第 三 种 状态 空间 常用 于 建 模 双方 博弈 问题 。 


3.1 概述 


搜索 技术 是 人 工 智能 的 基本 求解 技术 之 一 ,在 人 工 智 能 各 领域 中 被 广泛 
应 用 。 早 期 的 人 工 智能 程序 与 搜索 技术 联系 就 相当 紧密 ,几乎 所 有 的 早期 的 
人 工 智 能 程序 都 以 搜索 为 基础 。 例 如 ,A. Newell 和 H. A. Simon 等 人 编写 
的 LT(Logic Theorist) 程 序 ,J. Slagle 写 的 符号 积分 程序 SAINT,A. Newell 
和 了 H. A. Simon 写 的 GPS(General Problem Solver) 程 序 ，H. Gelernter 写 的 
Geometry Theorem-Proving Machine 程序 ，R. Fikes 和 N. Nilsson 写 的 
STRIPS(Stanford Research Institute Problem Solver) 程 序 以 及 A. Samuel 
写 的 Chechers 程序 等 ,都 使 用 了 搜索 技术 。 
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现在 ,搜索 技术 已 渗透 在 人 工 智 能 各 领域 中 ,例如 ,专家 系统 .自然 语言 理解 自动 程 
序 设计 ,模式 识别 、 机 器 人 学 \ 信 息 检索 和 博弈 等 领域 都 广泛 使 用 搜索 技术 。 搜 索 技 术 具 
有 如 此 丰富 应 用 领域 的 原因 在 于 : 广义 地 讲 , 人 工 智 能 的 大 多 数 问 题 都 可 以 转化 为 搜索 
问题 。 

人 工 智 能 需 处 理 的 问题 大 部 分 是 结构 不 良 或 非 结 构 化 问题 ,对 这 样 的 问题 一 般 不 存 
在 显而易见 的 求解 算法 。 对 于 给 定 的 问题 ,智能 系统 的 行为 首先 应 是 找到 能 够 达到 所 希 
望 目标 的 动作 序列 ,并 使 其 付出 的 代价 最 小 、 性 能 最 好 。 基 于 给 定 的 问题 ,问题 求解 的 第 
一 步 是 问题 的 建 模 。 搜 索 就 是 为 智能 系统 找到 动作 序列 的 过 程 。 搜 索 算法 的 输入 是 问题 
的 实例 ,输出 是 表示 为 动作 序列 的 方案 。 一 旦 有 了 方案 ,系统 就 可 以 执行 该 方案 给 出 的 动 
作 了 。 通 常 ,解决 一 类 问题 主要 包括 3 个 阶段 : 问题 建 模 、 搜 索 和 执行 ,而 且 多 数 实际 问 
题 都 需要 这 3 个 阶段 的 多 次 迭代 ,才能 予以 解决 。 本 章 主要 讨论 搜索 阶段 ,其 他 两 个 阶段 
会 在 其 他 章节 予以 讨论 。 能 进行 搜索 的 前 提 是 问题 具有 良好 的 结构 ,为 此 ,下 面 介绍 形式 
化 问题 模型 (formalized problem model) 。 

适 于 进行 搜索 的 问题 由 以 下 4 部 分 组 成 。 

(1) 初始 状态 (initial state) : 描述 了 Agent 在 问题 中 的 初始 状态 。 

(2) 动作 集合 (actions) : 每 个 动作 把 一 个 状态 转换 为 男 一 状态 。 

(3) 目标 检测 (goal test) 函数 : 用 于 判断 一 个 状态 是 否 为 目标 。 

(4) 路 径 费 用 (path cost) 函数 : 指明 路 径 费用 的 函数 。 此 函数 用 于 支持 搜索 算法 , 寻 
找 费 用 最 优 的 路 径 。 

其 中 ,初始 状态 和 动作 集合 ( 隐 式 ) 定 义 了 问题 空间 。 我 们 首先 解释 “定义 ”的 含义 , 然 
后 解释 “ 隐 式 ”的 用 意 。 问 题 空间 是 有 向 图 ,由 结 点 和 弧 组 成 。 根 据 (1) 和 (2) ,能 判断 给 定 
的 一 个 结 点 是 否 属 于 该 问题 空间 ,同样 ,能 判断 一 条 弧 是 否 属于 该 空间 。 因 此 说 ,(1) 和 
(2) 定 义 了 该 问题 空间 。 所 谓 “ 隐 式 ”, 是 相对 “ 显 式 ” 而 言 。 显 式 地 定义 一 个 问题 空间 的 方 
式 是 将 其 中 所 有 的 结 点 和 所 有 的 弧 罗 列 出 来 并 存储 在 内 存 中 。 然 而 ,对 于 人 工 智能 中 的 
非 平凡 问题 ,其 结 点 数目 和 弧 的 数目 都 是 巨大 的 , 若 罗 列 出 来 , 则 计算 机 的 存储 空间 或 许 
不 能 完全 存储 (试想 , 若 问题 空间 包含 10” 个 结 点 ,需要 多 大 的 内 存 空间 )。 当 内 存 不 能 支 
持 问 题 的 完全 存储 时 ,搜索 程序 则 无 法 开始 。 因 此 ,“ 隐 式 ” 的 问题 模型 是 搜索 技术 成 为 可 
行 的 关键 。 下 面 分 别 以 旅行 售 货 商 问题 (Traveling Salesperson Problem,TSP) 和 九宫 图 
问题 (Eight Puzzle Problem) 为 例 ,说 明 建 立 形式 化 模型 的 基本 方法 。 

TSP 问题 为 : 已 知 一 些 城市 和 这 些 城市 之 间 的 距离 ,为 售 货 商 找 到 一 条 从 初始 城市 
出 发 经 历 其 他 城市 仅 一 次 且 最 终 回 到 初始 城市 的 最 短路 径 。 当 然 ,其 中 的 “城市 ”可 以 为 
任意 距离 的 地 点 ,或 者 是 同城 内 的 地 点 。TSP 问题 与 我 们 当前 熟悉 的 快递 配送 业务 极其 
相关 ,也 适用 于 其 他 类 型 的 路 径 搜索 业务 。 图 3-1 是 一 个 TSP 问题 实例 ,其 中 含 4 个 城 
市 : A、B、C、D, 城 市 之 间 的 距离 在 边 上 标 出 。TSP 问题 虽然 在 生 
活 中 常见 ,但 在 计算 上 却 是 困难 的 。 理 论 上 .TSP 问题 的 计算 复 
杂 度 是 NP 完全 的 ,因而 成 为 人 工 智能 领域 的 典型 问题 。 针 对 
TSP 问题 ,怎样 用 “初始 状态 “动作 集合 “目标 检测 函数 ”和 “路 
径 费 用 函数 ”这 4 个 要 素 建 模 它 呢 ? 以 图 3-1 为 例 ,首先 需要 建 模 
旅行 商 的 状态 。 我 们 所 关心 的 状态 是 * 旅 行商 处 于 哪个 城市 "。 图 3-1 TSP 问题 实例 
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可 用 谓词 (at A) 表 示 旅 行商 在 A, 用 (at B) 表 示 旅 行商 在 B, 类 似 地 可 表示 旅行 商 在 某 个 
城市 的 状态 。 因 此 ,假设 旅行 商 初始 城市 为 A, 则 其 初始 状态 为 (at A)。 在 某 个 状态 上 ， 
旅行 商 可 以 做 旅行 的 动作 ,旅行 的 始点 是 当前 城市 .终点 是 下 一 个 相 邻 城市 。 可 用 move 
(CA, B) 表 示 旅 行商 从 城市 A 旅行 到 城市 B 的 动作 。 一 般 地 ,只 要 两 个 城市 x 和 y 存在 
边 , 且 旅行 商 当前 在 城市 x, 则 旅行 商都 可 以 做 move(x, y) 的 动作 ,该 动作 的 结果 是 将 旅 
行商 在 城市 x 的 状态 变换 为 在 城市 y 的 状态 ,如 对 于 动作 move(A, B), 它 对 应 的 状态 映 
射 见 表 3-1。 其 中 ,move(A, B) 在 某 状态 上 不 适用 时 ,我 们 假定 它 对 该 状态 不 发 生 改 变 。 
注意 ,在 表 3-1 中 ,动作 move(A, B) 只 在 一 个 状态 上 执行 ,但 在 其 他 类 型 的 问题 中 ,一 个 
动作 可 在 多 个 状态 上 执行 。 
表 3-1 动作 move(A, B) 定 义 的 状态 映射 








当前 状态 下 一 状态 当前 状态 下 一 状态 
(at A) (at B) (at C) (at C) 
(at B) (at B) (at D) (at D) 














在 明确 旅行 商 的 状态 和 动作 后 ,对 于 图 3-1 的 问题 ,你 能 较 轻 松 地 找 出 一 个 费用 最 优 
的 动作 序列 使 他 从 初始 位 置 A 经 历 {B, C, D} 仅 
一 次 并 返回 A 吗 ? 我 们 可 使 用 如 图 3-2 所 示 的 图 
尝试 所 有 的 动作 序列 ,该 图 是 以 宽度 优先 的 方式 
对 初始 状态 尝试 的 前 3 个 动作 。 当 一 个 动作 序列 me 


使 旅行 商 返回 位 置 A 时 ,我 们 应 检查 它 是 否 是 一 (atB) (at C) i 
个 有 效 解 。 例 如 ,动作 序列 mn。 《move CA，B)， 六 
move(B, D), move(D, C), move(C, A)) 为 有 效 


解 ,而 动作 序列 x: : (move(A, B), move(B, D)， 
move(D, C), move(C, B), move(B, A)) 不 是 有 
效 解 ,因为 它 访问 了 城市 B 两 次 ,而 不 是 一 次 。 我 
们 还 可 能 遇 到 另 一 个 有 效 解 x : (move(A, B), move(B, C), move(C, D), move(D, A))。 
现在 考虑 费用 因素 , 解 mm 的 费用 为 20 十 34 十 12 十 42 二 108; 解 xs 的 费用 为 20 十 30 十 12 十 
35 王 97, 所 以 rs 优 于 x1。 至 于 xs 是 否 为 最 优 解 , 需 在 尝试 所 有 的 有 效 解 之 后 断定 。 
基于 以 上 分 析 ,将 TSP 问题 的 形式 化 模型 概括 如 下 。 
。 初始 状态 : 若 旅 行商 的 初始 位 置 为 a, 则 将 (at a) 作 为 初始 状态 。 
。 动作 集合 : 若 两 个 位 置 x 和 y 之 间 有 一 条 边 , 则 动作 move(z，y) 在 该 集合 中 。 
。 目标 检测 函数 : 对 于 一 个 状态 *, 若 从 初始 状态 到 * 的 动作 序列 x 经 过 了 其 余 所 有 
位 置 仅 1 次 , 且 在 * 中 旅行 商 回 到 了 初始 位 置 , 则 s 是 目标 状态 , 且 x 是 一 个 有 
效 解 。 
。 路 径 费 用 函数 : 动作 序列 x 的 费用 等 同 于 它 经 过 的 路 径 的 距离 。 
下 面 介绍 对 九宫 图 问题 的 一 种 形式 化 。 九 宫 图 问题 是 : 要 求 Agent 改变 一 个 3 行 3 
列 棋盘 上 的 8 个 数码 的 位 置 , 使 这 些 数码 的 排列 符合 预期 的 格局 。 在 图 3-3 中 ,改变 其 中 
数码 的 方式 是 将 “空白 格 ”( 未 被 数码 占据 的 方 格 ) 向 左 移 、 向 上 移 、 向 右 移 。 进 一 步 讲 , 若 


move(A, D) 








图 3-2 在 状态 上 应 用 动作 而 
构成 的 状态 空间 
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“空白 格 ” 位 于 当前 的 数码 6 的 位 置 , 则 它 还 可 向 下 移 。 















































2 8 3 | [i213 | 
1 | 6 4 8 4 
717+ 45 71615 
(a) 一 个 棋盘 格局 和 可 执行 的 动作 方向 (b) 期 望 的 目标 格局 
图 3-3 九宫 图 问题 
九宫 图 问题 的 形式 化 模型 为 


。 初始 状态 : 棋盘 的 初始 格局 ,包含 每 个 格子 中 存放 的 数码 .空白 格 的 位 置 。 

。 动作 集合 : {空白 格 左 移 , 空 白 格 上 移 , 空 白 格 右 移 , 空 白 格 下 移 }。 其 中 的 动作 不 
是 在 每 个 状态 上 都 可 执行 。 例 如 ,当空 白 格 位 于 最 左 侧 的 列 时 ,“ 空 白 格 左 移 ” 动 
作 不 可 执行 。 

目标 检测 函数 : 若 一 个 状态 中 的 棋盘 格局 与 图 3-3(b) 相 同 , 则 它 是 目标 状态 ,并 
且 从 初始 状态 到 * 的 动作 序列 是 该 问题 的 一 个 解 。 

路 径 费用 函数 : 此 问题 中 每 个 动作 的 代价 假设 为 1, 因 此, 路径 费用 与 该 路 径 上 的 
动作 数目 在 数值 上 相同 。 

对 于 九宫 图 问题 的 求解 ,也 可 以 尝试 画 出 如 图 3-2 所 示 的 有 向 图 一 一 状态 空间 ,然后 
进行 搜索 。 此 状态 空间 中 的 状态 数目 是 巨大 的 ,普通 计算 机 的 内 存 不 能 完全 存储 。 为 了 
说 明 ,我 们 假设 需要 40 步 动 作 解决 一 个 九宫 图 问题 ,相应 地 ,目标 状态 结 点 所 在 的 深度 为 
40。 那 么 ,在 最 坏 情况 下 ,我 们 需要 尝试 多 少 个 状态 才能 达到 这 个 目标 呢 ? 这 需要 我 们 分 
析 该 状态 空间 的 平均 分 枝 因 子 。 因 为 ,车 它 为 b, 则 最 坏 情况 下 我 们 需要 尝试 1 十 b 十 b? 十 
己 十 … 十 b” 个 状态 。 九 宫 图 问题 的 分 枝 因子 分 布 如 图 3-4 所 示 。 2 不 [3 个 [2 不 
对 于 第 一 行 , 若 空白 格 位 于 最 左 侧 的 方 格 , 则 可 执行 2 个 动作 (向 3 个 [4 个 [3 不 
右 移 、 向 下 移 ) , 若 它 位 于 中 间 的 方 格 , 则 可 执行 3 个 动作 (向 左 移 、 2 个 | 3 个 | ?个 
向 右 移 、 向 下 移 ) , 若 它 位 于 最 右 侧 的 方 格 , 则 可 执行 2 个 动作 (向 
左 移 、 向 下 移 )。 类 似 地 ,可 得 出 空白 格 在 其 他 位 置 时 的 可 执行 动 
作 数 。 注 意 ,在 每 个 状态 中 ,空白 格 只 处 于 其 中 一 个 位 置 。 因 此 ， 
平均 情况 下 ,一 个 状态 上 可 执行 的 动作 数 为 b= 二 (2X4 十 3X4 十 4)/9 和 2. 667。 现 在 可 知 ， 
最 坏 情况 下 需要 尝试 的 状态 数目 至 少 是 2. 667”。 因 为 存储 一 个 状态 至 少 需要 9 个 二 进 
制 位 ,所 以 这 些 状态 需要 的 存储 空间 为 2.667”X9 位 二 2*B 二 2*GB 二 2TB。 这 个 数量 显 
然 超出 了 当前 流行 的 个 人 计算 机 的 内 存 存储 量 。 

为 了 在 部 分 程度 上 缓解 对 存储 量 的 要 求 . 人 工 智能 中 的 搜索 可 以 分 成 两 个 不 断交 
替 的 阶段 : 问题 空间 的 生成 和 在 该 空间 上 对 目标 状态 的 搜索 , 即 状态 空间 一 般 是 逐渐 
扩展 的 ,“ 目 标 ” 状 态 是 在 每 次 扩展 的 时 候 进行 判断 的 。 不 过 ,多 数 搜索 算法 也 存储 访 
问 过 的 状态 ,这 使 得 所 需 的 存储 空间 快速 增加 。 解 决 的 一 个 途径 是 引导 搜索 算法 专注 
于 探索 有 希望 发 现 目标 的 方向 ,用 于 完成 引导 的 信息 成 为 启发 信息 ,此 技术 将 在 3. 3. 3 
节 开 始 介绍 。 

一 般 地 ,搜索 方法 可 以 根据 是 否 使 用 启发 式 信息 分 为 盲目 搜索 方法 和 启发 式 搜索 方 
法 。 也 可 以 根据 搜索 空间 的 表示 方式 分 为 状态 空间 搜索 方法 和 与 或 图 搜索 方法 。 状 态 空 




















图 3-4 九宫 图 问题 的 
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间 搜 索 是 用 状态 空间 法 求解 问题 所 进行 的 搜索 。 与 或 图 搜索 是 指 用 问题 规约 方法 求解 问 
题 时 所 进行 的 搜索 。 状 态 空 间 法 和 问题 规约 法 是 人 工 智 能 中 最 基本 的 两 种 问题 表示 
方法 。 

盲目 搜索 方法 一 般 是 指 从 当前 的 状态 到 目标 状态 需要 走 多 少 步 或 者 每 条 路 径 的 花费 
并 不 知道 ,所 能 做 的 只 是 可 以 区 分 出 哪个 是 目标 状态 。 因 此 , 它 一 般 是 按 预定 的 搜索 策略 
进行 搜索 。 由 于 这 种 搜索 总 是 按 预 定 的 ,机械 的 顺序 进行 ,没有 考虑 到 问题 本 身 含 有 的 信 
息 ,所 以 这 种 搜索 具有 很 大 的 盲目 性 ,效率 不 高 ,不 适用 于 复杂 问题 的 求解 。 启 发 式 搜索 
方法 是 在 搜索 过 程 中 通过 分 析 与 问题 有 关 的 信息 调整 搜索 顺序 ,用 于 指导 搜索 朝 着 最 有 
希望 发 现 目标 状态 的 方向 前 进 ,加 速 问题 的 求解 并 找到 最 优 解 。 显 然 , 盲 目 搜索 不 如 启发 
式 搜索 效率 高 ,但 是 由 于 启发 式 搜索 需要 和 问题 本 身 特 性 有 关 的 信息 ,而 对 于 很 多 问题 这 
些 信息 很 少 ,或 者 根本 就 没有 ,或 者 很 难 抽取 ,所 以 盲目 搜索 仍然 是 很 重要 的 一 类 搜索 
方法 。 

在 搜索 问题 中 ,主要 的 工作 是 找到 正确 的 搜索 算法 。 搜 索 算法 一 般 可 以 通过 下 面 4 
个 标准 评价 。 

(1) 完备 性 : 如 果 存 在 一 个 解 , 该 策略 是 否 保证 能 够 找到 ? 

(2) 时 间 复 杂 性 : 需要 多 长 时 间 可 以 找到 解 ? 

(3) 空间 复杂 性 : 执行 搜索 需要 多 少 存 储 空间 ? 

(4) 最 优 性 : 如 果 存 在 不 同 的 几 个 解 ,该 算法 是 否 可 以 发 现 最 优 代 价 的 解 ? 

搜索 算法 指定 了 状态 空间 或 问题 空间 扩展 的 方法 ,也 决定 了 状态 或 问题 的 访问 顺序 。 
不 同 的 搜索 算法 在 人 工 智 能 领域 的 命名 也 不 同 。 例 如 ,在 状态 空间 为 一 棵 树 的 问题 上 有 
两 种 基本 的 搜索 算法 。 如 果 首 先 扩展 根 结 点 ,然后 扩展 根 结 点 生成 的 所 有 结 点 ,最 后 再 扩 
展 这 些 结 点 的 后 继 ,如 此 反复 下 去 ,这 种 算法 称 为 宽度 优先 搜索 。 另 一 种 方法 是 ,在 树 的 
最 深 一 层 的 结 点 中 扩展 一 个 结 点 ,只 有 当 搜 索 遇 到 一 个 死亡 结 点 ( 非 目 标 结 点 并 且 是 无 法 
扩展 的 结 点 ) 的 时 候 , 才 返回 上 一 层 选择 其 他 的 结 点 搜索 ,这 种 算法 称 为 深度 优先 搜索 。 
然而 ,无 论 是 宽度 优先 搜索 ,还 是 深度 优先 搜索 , 结 点 的 遍历 顺序 都 是 固定 的 , 即 一 旦 搜索 
空间 给 定 , 结 点 遍历 的 顺序 就 固定 了 ,这 种 类 型 的 遍历 称 为 “确定 性 ?的 ,也 就 是 盲目 搜索 。 
而 对 于 启发 式 的 搜索 ,在 计算 每 个 结 点 的 参数 之 前 无 法 确定 先 选择 哪个 结 点 扩展 ,这 种 搜 
索 一 般 称 为 非 确 定 的 。 

在 介绍 搜索 方法 前 ,我 们 再 对 问题 模型 做 一 些 重要 的 说 明 。 首 先 , 人 工 智 能 问题 的 分 
类 可 依据 多 个 角度 ,但 从 一 个 问题 所 涉及 的 角色 数目 看 ,有 涉及 单个 Agent 的 问题 (如 旅 
行 售 货 商 问题 ) ,涉及 两 个 对 抗 Agent 的 问题 (如 双人 博弈 问题 ) ,涉及 多 个 Agent 协作 的 
问题 (如 团队 协作 问题 ) ,涉及 两 组 Agent 的 问题 (如 两 队 机 器 人 足球 竞赛 问题 ) ,涉及 多 
组 Agent 的 问题 (各 组 之 间或 者 对 抗 或 者 协作 )。 注 意 , 本 章 介绍 的 算法 是 以 单方 面 解决 
问题 而 设计 的 搜索 技术 。“ 单 方面 ”的 含义 为 : 即使 待 解决 的 问题 涉及 多 方 ,正在 思考 的 
本 方 也 是 将 本 方 的 动作 和 其 他 各 方 的 动作 一 起 考虑 的 。 其 次 ,本章 的 问题 模型 假设 本 方 
“完全 知道 ”自己 和 其 他 各 方 的 状态 和 他 们 能 采取 的 行动 。 然 而 ,在 实际 问题 中 ,或 许 本 方 
不 可 获取 其 他 方 的 信息 ,或许 本 方 可 获取 其 他 方 的 部 分 信息 .甚至 本 方 对 自己 的 一 些 状态 
的 具体 数据 也 不 可 知 。 此 类 情况 下 的 问题 通常 称 为 具有 不 完全 信息 的 问题 ,对 应 的 算法 
研究 成 果 也 相当 丰富 ,但 是 限于 篇 幅 , 我 们 仅 在 3. 5 节 介 绍 其 中 的 一 项 研究 。 最 后 ,多 数 
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研究 认为 : Agent 若 要 表现 理性 , 则 在 它 的 脑 中 必然 要 有 一 个 关于 所 处 世界 的 状态 模型 ， 
而 这 个 状态 模型 是 人 类 赋予 Agent 的 ,因此 ,合理 的 世界 模型 的 建立 工作 是 思考 (搜索 ) 
能 实用 的 前 提 。 


3.2 育 目 搜索 方法 


最 简单 的 盲目 搜索 方法 是 “生成 再 测试 ?方法 (generate and test) 。 该 方法 如 下 。 


Procedure Generate & Test 
Begin 
Repeat 
生成 一 个 新 的 状态 , 称 为 当前 状态 ; 
Until 当前 状态 = 目标; 
End. 

上 述 算法 在 每 次 Repeat-Until 循环 中 都 生成 一 个 新 的 状态 ,并 且 只 有 当 新 的 状态 等 
于 目标 状态 的 时 候 才 退出 。 在 该 算法 中 ,最 重要 的 部 分 是 新 状态 的 生成 。 如 果 生 成 的 新 
状态 不 可 扩展 , 则 该 算法 应 该 停止 ,为 了 简单 起 见 , 在 上 述 算法 中 省 略 了 这 一 部 分 。 

宽度 优先 搜索 和 深度 优先 搜索 算法 可 以 看 作 是 生成 再 测试 方法 的 两 个 具体 版 本 。 它 
们 的 区 别 是 生成 新 状态 的 顺序 不 同 。 假 设 问 题 空 间 是 一 棵 树 , 则 深度 优先 搜索 总 是 优先 
生成 并 测试 深度 增加 的 结 点 ,而 宽度 优先 搜索 则 总 是 优先 考察 同一 深度 的 结 点 。 

下 面 介 绍 的 “迭代 加 深 搜索 "方法 结合 宽度 优先 搜索 保证 最 优 性 的 优势 与 深度 优先 搜 
索 在 存储 上 的 优势 。 

对 于 深度 d 比较 大 的 情况 ,深度 优先 搜索 可 能 沿 着 一 个 不 含 目标 结 点 的 分 枝 探 寻 很 
长 时 间 ,在 找 不 到 解 的 同时 浪费 资源 。 一 种 较 好 的 方法 是 对 搜索 的 深度 进行 控制 ,这 就 是 
“有 界 深度 优先 搜索 ”方法 的 主要 思想 。 有 界 深度 优先 搜索 过 程 总 体 上 按 深 度 优先 算法 方 
法 进行 ,但 对 搜索 深度 给 出 一 个 深度 限制 du , 当 深度 达到 d 的 时 候 , 如 果 还 没有 找到 解 
答 ,就 停止 对 该 分 枝 的 搜索 , 换 到 另外 一 个 分 枝 进行 搜索 。 

对 于 有 界 深度 搜索 策略 ,有 以 下 几 点 需要 说 明 。 

(1) 在 有 界 深度 搜索 算法 中 ,深度 限制 d 是 一 个 很 重要 的 参数 。 当 问题 有 解 , 且 解 
的 路 径 长 度 小 于 或 等 于 dv 时 , 则 该 算法 一 定 能 够 找到 解 。 但 是 ,和 深度 优先 搜索 一 样 ， 
这 并 不 能 保证 最 先 找到 的 是 最 优 解 ,此 情况 下 的 有 界 深度 搜索 是 完备 的 ,但 不 是 最 优 的 。 
但 是 , 当 du 取得 太 小 , 解 的 路 径 长 度 大 于 d 时 , 则 搜索 过 程 中 就 找 不 到 解 ,此 情况 下 的 
搜索 过 程 甚至 是 不 完备 的 。 

(2) 深度 限制 d，, 不 能 太 大 。 当 d，, 太 大 时 ,搜索 过 程 会 产生 过 多 的 无 用 结 点 , 既 浪费 
了 计算 机 资源 ,又 降低 了 搜索 效率 。 

(3) 有 界 深度 搜索 的 主要 问题 是 深度 限制 值 du 的 选取 。 该 值 也 被 称 为 状态 空间 的 
直径 ,如 果 该 值 设置 得 比较 合适 , 则 会 得 到 比较 有 效 的 有 界 深 度 搜 索 。 但 是 对 很 多 问题 ， 
我 们 预先 无 法 知道 该 值 到 底 为 多 少 , 只 有 在 该 问题 求解 完成 后 才能 确定 出 深度 限制 d,,， 
而 那 时 确定 的 wd 对 搜索 算法 没有 意义 。 为 了 解决 上 述 问题 ,可 采用 如 下 改进 方法 : 先 任 
意 设 定 一 个 较 小 的 数 作为 du ,然后 按 有 界 深 度 算 法 搜索 , 若 在 此 深度 限制 内 找到 了 解 , 则 
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算法 结束 ;如 在 此 限制 内 没有 找到 问题 的 解 , 则 增 大 深度 限制 dv ,继续 搜索 。 此 方法 被 命 
名 为 “迭代 加 深 搜 索 ”(iterative deepening search)。 

迭代 加 深 搜索 是 一 种 回避 选择 最 优 深度 限制 问题 的 策略 , 它 是 试图 尝试 所 有 可 能 的 
深度 限制 : 首先 深度 为 0, 然后 深度 为 1 ,最 后 为 2, 等 等 ,一 直 进 行 下 去 。 如 果 初 始 深 度 为 
0, 则 该 算法 只 生成 根 结 点 ,并 检测 它 。 如 果 根 结 点 不 是 目标 , 则 深度 加 1, 通过 典型 的 深 
度 优先 算法 ,生成 深度 为 1 的 树 。 同 样 , 当 深 度 限 制 为 m 时 , 它 将 生成 深度 为 m 的 树 。 

迭代 加 深 搜索 过 程 描述 如 下 。 


Procedure Iterative- deeping 
Begin 
For d=1 to Do 
Begin 
从 初始 结 点 执行 深度 限制 为 a 的 有 界 深度 优先 搜索 ; 
如 果 找 到 解 , 则 搜索 结束 并 返回 "成 功 "; 


如 果 本 次 迭代 中 访问 的 所 有 结 点 的 深度 都 小 于 a, 则 搜索 结束 并 返回 "失败 "; 
End 


End 


通过 分 析 可 以 发 现 ,迭代 加 深 搜 索 看 起 来 很 浪费 资源 ,因为 它 在 深度 限制 为 a 十 1 的 
和 迭代 过 程 中 将 重复 搜索 深度 限制 为 d 的 迭代 访问 过 的 结 点 。 然 而 ,对 于 很 多 问题 ,这 种 
多 次 的 扩展 负担 实际 上 很 小 ,直觉 上 可 以 想象 ,如 果 一 棵 树 的 分 枝 系 数 很 大 ,几乎 所 有 的 
结 点 都 在 最 底层 上 , 则 对 于 上 面 各 层 结 点 ,扩展 多 次 对 整个 系统 的 影响 不 是 很 大 。 

宽度 优先 搜索 ,深度 优先 搜索 和 迭代 加 深 搜 索 都 是 “生成 再 测试 "算法 的 具体 版 本 。 
迁 代 加 深 搜 索 对 结合 了 宽度 优先 和 深度 优先 搜索 的 优点 。 表 3-2 总 结 了 宽度 优先 搜索 、 
深度 优先 搜索 有 界 深度 搜索 和 迭代 加 深 搜 索 的 主要 特点 。 

表 3-2 几 个 言 目 搜索 算法 的 特点 对 比 














标准 宽度 优先 深度 优先 有 界 深度 和 迭代 加 深 
时 间 O(C1) Ob™) Ob) OC) 
空间 Ow) Obm) OWwL) Obd) 
最 优 是 否 否 是 

完备 是 否 如 果 /! > d, 是 是 

















注 : 0 为 分 枝 系数 ,d 为 解 的 深度 ,m 是 搜索 树 的 最 大 深度 ,! 是 深度 限制 。 


3.3 局 发 式 搜索 


前 面 讨论 的 搜索 方法 都 是 按 事 先 规定 的 、 根 据 结 点 的 深度 制定 的 路 线 进行 搜索 ,搜索 
过 程 机 械 化 .具有 较 大 的 盲目 性 .生成 的 无 用 结 点 较 多 ,搜索 空间 较 大 ,效率 因而 不 高 。 除 
了 结 点 的 深度 信息 之 外 ,如 果 能 够 利用 结 点 暗含 的 与 问题 相关 的 一 些 特征 信息 预测 目标 
结 点 的 存在 方向 ,并 沿 着 该 方向 搜索 , 则 有 和 希望 缩小 搜索 范围 ,提高 搜索 效率 。 利 用 结 点 
的 特征 信息 引导 搜索 过 程 的 一 类 方法 称 为 启发 式 搜索 。 
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任何 一 种 启发 式 搜索 算法 在 生成 一 个 结 点 的 全 部 子 结 点 之 前 ,都 将 使 用 算法 设计 者 
提供 的 评估 函数 判断 这 个 “生成 ”过 程 是 否 值得 进行 。 评 估 函 数 通常 为 每 个 结 点 计算 一 个 
整数 值 , 称 为 该 结 点 的 评估 函数 值 。 通 常 ,评估 函数 值 小 的 结 点 被 认为 是 值得 进行 “生成 ” 
过 程 。 按 照 惯例 ,我 们 将 “生成 结 点 n 的 全 部 子 结 点 ” 称 为 “扩展 结 点 n”。 启 发 式 搜索 可 
以 用 于 两 种 不 同方 向 的 搜索 : 前 向 搜索 和 反 向 搜索 。 前 向 搜索 一 般 用 于 状态 空间 的 搜 
索 , 从 初始 状态 出 发 向 目标 状态 方向 进行 ; 反 向 搜索 一 般 用 于 问题 规约 中 ,从 给 定 的 目标 
状态 向 初始 状态 进行 。 为 这 两 种 搜索 方法 设计 评估 函数 时 应 采用 不 同 的 思路 ,将 在 3. 3. 1 
节 和 3.4.3 节 分 别 解释 这 个 特点 。 


3.3.1 启发 性 信息 和 评估 函数 


在 搜索 过 程 中 ,关键 是 在 下 一 步 选择 哪个 结 点 进行 扩展 ,选择 的 方法 不 同 ,就 形成 了 
不 同 的 搜索 策略 。 如 果 在 选择 结 点 时 能 充分 利用 它 与 问题 有 关 的 特征 信息 估计 出 它 对 尽 
快 找到 目标 结 点 的 重要 性 ,就 能 在 搜索 时 选择 重要 性 较 高 的 结 点 ,以 便 快 速 找到 解 或 者 最 
优 解 , 我 们 称 这 样 的 过 程 为 启发 式 搜索 。“ 启 发 式 " 实 际 上 是 一 种 “大 拇指 准则 (Thumb 
Rules)”: 在 大 多 数 情 况 下 是 成 功 的 ,但 不 能 保证 一 定 成 功 的 准则 。 

用 来 评估 结 点 重要 性 的 函数 称 为 评估 函数 。 评 佑 函数 /(n) 对 从 初始 结 点 So 出 发 ， 
经 过 结 点 n 到 达 目 标 结 点 Ss 的 路 径 代价 进行 估计 。 其 一 般 形式 为 

fn) = gn) th(n) 
其 中 ,g(n) 表 示 从 初始 结 点 So。 到 结 点 n 的 已 获知 的 最 小 代价 ;h(n) 表 示 从 到 目标 结 点 
Ss 的 最 优 路 径 代价 的 估计 值 , 它 体现 了 问题 的 启发 式 信息 。 所 以 ,jz) 被 称 为 启发 式 函 
数 。g (nn) 和 h(n) 的 定义 都 要 根据 当前 处 理 的 问题 的 特性 而 定 ,h(n) 的 定义 更 需要 算法 设 
计 者 的 创造 力 。 下 面 介绍 在 九宫 图 问题 上 g(n) 和 h(n) 的 定义 方法 。 

在 九宫 图 问题 中 ,有 一 个 3X3 的 棋盘 ,其 中 8 个 格子 上 放 着 带 数 字 的 卡片 ,1 个 格子 
空白 ,每 张 卡片 可 以 被 移动 到 与 它 相 邻 的 空白 格子 ,我 们 的 目标 是 将 棋盘 上 卡片 的 初始 格 
局 通过 一 系列 移动 卡片 的 动作 变换 到 目标 格局 。 图 3-5 是 九宫 图 问题 的 一 个 实例 ,其 中 
So 表示 初始 格局 ,S。 表示 目标 格局 。 评 估 函 数 可 以 表示 为 

fn) = gn) t+h(n) 

其 中 ,g(n) 二 d(n) 定 义 为 结 点 在 n 搜索 树 中 的 深度 ;h(n) 二 w(n) 定 义 为 * 结 点 中 不 在 目 
标 状态 中 相应 位 置 的 数码 个 数 ",h(m) 包 含 了 问题 的 一 一- 
启发 式 信息 。 可 以 看 出 ,一 般 说 菜 结 点 的 hw) 越 -上 ss 
大 , 即 “ 不 在 目标 位 ”的 数码 个 数 越 多 ,说 明 目 标 结 点 7 5 7|615 
离 nn 越 远 ,进而 可 以 认为 “扩展 ”n 就 相对 不 重要 。 在 

图 3-5 中 ,对 于 初始 结 点 So ,由 于 g(Su) 一 0,)(Su) 一 5， 

因此 f(S。)==5。 

FOOD 由 go) 和 六 (2) 两 部 分 组 成 ,启发 式 搜索 算法 可 以 使 用 f(n) 的 不 同 组 合 ,进而 表 
现 出 不 同 的 特性 。 例 如 ,有 的 算法 使 用 /Coz) 一 g(z), 有 的 算法 使 用 /(n) 二 h(n), 有 的 算 
法 使 用 Faz) 一 g(Cz) 十 ACz)。 下 面 将 介绍 最 好 优先 搜索 (Best-first Search) 算 法 使 用 不 同 
形式 的 三 所 表现 出 的 特点 。 
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图 3-5 九宫 图 问题 的 一 个 实例 
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3.3.2 最 好 优先 搜索 算法 


宽度 优先 搜索 和 深度 优先 搜索 不 适用 于 状态 空间 存在 “ 环 ” 的 情况 ,下 面 介 绍 一 种 称 
为 “最 好 优先 搜索 算法 ”(best-first search) 的 算法 框架 ,该 方法 能 处 理 图 。 为 了 处 理 “ 环 ”， 
“最 好 优先 搜索 算法 ”用 OPEN 表 和 CLOSED 表 记 录 状 态 空间 中 那些 被 访问 过 的 所 有 状 
态 。 这 两 个 表 中 的 结 点 及 它们 关联 的 边 构 成 了 状态 空间 的 一 个 子 图 ,被 称 为 搜索 图 。 
OPEN 表 存 储 一 些 结 点 ,其 中 每 个 结 点 的 启发 式 函 数值 已 经 计算 出 来 ,但 是 还 没有 被 
“扩展 ”。CLOSED 表 存 储 一 些 结 点 ,其 中 每 个 结 点 已 经 被 扩展 。 该 类 算法 每 次 迭代 从 
OPEN 表 中 取出 一 个 较 优 的 结 点 进行 扩展 ,将 n 的 每 个 子 结 点 根据 情况 放 入 OPEN 
表 。 算 法 循环 ,直到 发 现 目标 结 点 或 者 OPEN 表 为 空 。 算 法 中 的 每 个 结 点 都 带 有 一 个 父 
指针 ,该 指针 用 于 合成 解 路 径 。 

最 好 优先 搜索 算法 的 具体 描述 如 下 。 


Procedure Graph- Search 
Begin 
建立 只 含 初始 结 点 & 的 搜索 图 6, 计 算 f(s,); 将 5 放 入 oPEN 表 ;将 cosED 表 初始 化 为 空 
While OPEN 表 不 空 Do 
Begin 
从 oPEN 表 中 取出 Ff(n) 值 最 小 的 结 点 n, 将 n 从 oPEN 表 中 删除 并 放 入 cLosED 表 
If n 是 目标 结 点 Then 根据 n 的 父 指针 指出 从 s, 到 n 的 路 径 , 算 法 停止 
Else 
Begin 
扩展 结 点 n 
If 结 点 n 有 子 结 点 
Then 
Begin 
上) 生成 n 的 子 结 点 集合 tm} 把 m 作为 n 的 子 结 点 加 入 到 6 中 ,并 计算 flm) 
(2)IE ms 未 曾 在 OPEN 和 CLOSED 表 中 出 现 ,Then 将 它们 配 上 刚 计算 过 的 f 值 ,将 
m 的 父 指针 指向 n, 并 把 它们 放 入 oPEN 表 
(3)IE m 已 经 在 OPEN 表 中 ,Then 该 结 点 一 定 有 多 个 父 结 点 ,在 这 种 情况 下 , 比 
较 m 相对 于 n 的 f 值 和 ms 相对 于 其 原 父 指针 指向 的 结 点 的 工 值 , 若 前 者 不 
小 于 后 者 , 则 不 做 任何 更 改 , 否 则 将 m 的 f 值 更 改 为 m 相对 于 n 的 f 值 ,ms 
的 父 指针 更 改 为 n 
(4)If m 已 经 在 CLOSE 表 中 ,Then 该 结 点 同样 也 有 多 个 父 结 点 。 在 这 种 情况 
下 ,比较 m 相对 于 n 的 F 值 和 ms 相对 于 其 原 父 指针 指向 的 结 点 的 f 值 。 如 
果 前 者 不 小 于 后 者 , 则 不 作 任 何 更 改 ,否则 将 m 从 cLosED 表 移 到 oPEN 表 ， 
置 m 的 父 指针 指向 n 
(5) 按 f 值 从 小 到 大 的 次 序 对 oPEN 表 中 的 结 点 重新 排序 


End 


End 
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上 述 搜索 算法 生成 一 个 明确 的 图 G( 称 为 搜索 图 ) 和 一 个 G 的 子 集 T( 称 为 搜索 树 )， 
图 G 中 的 每 一 个 结 点 也 在 树 了 了 上。 搜索 树 是 由 结 点 的 父 指针 确定 的 。G 中 的 每 一 个 结 
点 (除了 初始 结 点 So ) 都 有 一 个 指向 G 中 一 个 父辈 结 点 的 指针 。 该 父辈 结 点 就 是 那个 结 
点 在 工 中 的 唯一 父辈 结 点 。 算 法 中 的 (3)、(4) 步 保证 对 每 一 个 扩展 的 新 结 点 ,其 父 指针 
的 指向 是 已 经 产生 的 路 径 中 代价 最 小 的 。 


3.3.3 贪 楚 最 好 优先 搜索 算法 


最 好 优先 搜索 算法 是 一 个 通用 的 算法 框架 。 如 果 将 该 框架 中 的 F(Cz) 实 例 化 为 
了 (0) 二 h(n) , 则 得 到 一 个 具体 的 算法 , 称 为 贪 焚 最 好 优先 搜索 (Greedy Best-first Search， 
GBFS) 算 法 。 可 以 看 出 ,GBFS 算法 在 判断 是 否 优 先 扩展 一 个 结 点 时 仅 以 的 启发 值 
有 (7) 为 依据 。h(n) 值 越 小 表明 从 nn 到 目标 结 点 的 代价 越 小 ,因而 GBFS 算法 沿 着 n 所 在 
的 分 枝 搜索 就 越 可 能 发 现 目 标 结 点 。 因 此 ,GBFS 算法 一 般 可 以 较 快 地 计算 出 问题 的 解 。 

但 是 ,GBFS 算法 得 出 的 解 是 否 是 最 优 的 ? 考虑 如 下 情况 ,OPEN 表 中 有 两 个 结 点 并 
和 nn ,其 中 g(7) 二 5, 有 (7) 二 0,g(n) 二 3, hn) 二 1, 而 且 n 和 nn 的 hh 值 分 别 是 它们 与 目 
标 结 点 的 真实 距离 ,在 此 情况 下 ,GBFS 将 扩展 ,而 不 是 n 。 显 然 , 经 过 发 现 的 解 的 代 
价 高 于 经 过 n' 发 现 的 解 的 代价 ,所 以 GBFS 返回 的 不 是 最 优 解 。 仔 细 分 析 最 好 优先 算法 
的 流程 可 以 发 现 , 当 f(n) 二 h(n) 时 ,其 中 的 步骤 (3) 和 (4) 将 不 会 改变 的 信息 。3. 3. 4 
节 内 容 将 说 明 , 步 又 (3) 和 (4) 是 为 了 保证 算法 的 最 优 性 而 设置 的 。 与 GBFS 算法 相对 , 假 
如 最 好 优先 搜索 算法 中 的 /() 被 实例 化 为 (7) 二 g(n), 则 得 到 “宽度 优先 搜索 ”算法 。 
读者 可 以 在 图 的 最 短路 径 问题 上 将 g(n) 定 义 为 源 结 点 到 的 路 径 长 度 , 分 析 此 命题 的 正 
确 性 。 

可 以 看 出 ,h(n) 影 响 算法 发 现 解 的 速度 ,g(n) 影 响 得 到 解 的 最 优 性 。 下 面 介 绍 的 A 
算法 和 A* 是 使 用 /(m) 二 g(n) 十 h(n) 的 最 好 优先 搜索 算法 ,它们 综合 考虑 了 时 间 效 率 和 
解 的 质量 。 其 中 ,A* 算法 使 用 的 h(n) 具有 更 严格 的 性 质 。 








3.3.4 A 算法 和 A’* 算 法 


如 果 最 好 优先 搜索 算法 中 的 /x0) 被 实例 化 为 /7) 二 g 67) 十 h(n), 则 称 为 A 算法。 
进一步 细 化 ,如 果 启 发 函数 满足 对 于 任 一 结 点 n ,h(n) 的 值 都 不 大 于 到 目标 结 点 的 最 
优 代价 , 则 称 此 类 A 算法 为 A* 算 法 。A* 算 法 在 一 些 条 件 下 能 够 保证 找到 最 优 解 , 即 A* 
算法 具有 最 优 性 。 下 面 首先 以 九宫 图 (图 3-6) 为 例 介绍 A 算法 的 运行 过 程 ,之 后 介绍 参 
考 文献 L[34] 对 A* 算法 最 优 性 的 分 析 。 

A 算法 采用 3. 3. 1 节 定 义 的 评估 函数 判断 每 个 结 点 的 重要 性 。 在 该 算法 运行 的 初始 
时 刻 ,OPEN 表 中 只 有 初始 结 点 ,因此 我 们 扩展 它 , 得 到 图 3-6 中 的 第 二 层 结 点 ,将 这 些 结 
点 全 部 放 入 OPEN 表 。 在 第 二 次 迭代 过 程 中 ,人 A 算法 选择 OPEN 表 中 具有 最 小 f 值 为 
1 十 3 二 4 的 结 点 扩展 ,得 到 第 三 层 的 三 个 结 点 ,并 将 它们 放 入 OPEN 表 。 在 第 三 次 迭代 
中 ,A 算法 选择 OPEN 表 中 / 值 为 2 十 3 二 5 的 结 点 进行 扩展 。 在 第 四 次 迭代 中 ,人 A 算法 
选择 OPEN 表 中 f 值 为 2 十 3 二 5 的 另 一 个 结 点 进行 扩展 。 在 第 五 次 迭代 中 ,A 算法 选择 
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图 3-6 ”九宫 图 问题 的 全 局 择优 搜索 树 


OPEN 表 中 / 值 为 3 十 2==5 的 结 点 进行 扩展 。 在 第 六 次 迭代 中 ,A 算法 选择 OPEN 表 中 
了 值 为 4 十 1=5 的 结 点 进行 扩展 。 在 第 七 次 迭代 中 ,A 算法 选择 OPEN 表 中 f 值 为 
5 十 0 三 5 的 结 点 进行 扩展 。 通 过 此 例 可 以 发 现 ,A 算法 相对 于 宽度 优先 搜索 和 深度 优先 
搜索 都 具有 优势 。 

但 是 ,由 于 对 启发 函数 hh 没有 任何 限制 ,A 算法 不 能 保证 找到 最 优 解 。 经 研究 发 现 ， 
A 算法 在 如 下 三 个 条 件 均 成 立时 ,能 够 保证 得 到 最 优 解 。 

(1) 启发 函数 及 对 任 一 结 点 n 都 满足 h(n) 不 大 于 到 目标 的 最 优 代价 。 

(2) 搜索 空间 中 的 每 个 结 点 都 具有 有 限 个 后 继 。 

(3) 搜索 空间 中 的 每 个 有 向 边 的 代价 均 为 正 值 。 

为 了 表明 此 类 A 算法 的 重要 性 ,将 此 类 A 算法 称 为 A* 算法 ;我 们 称 上 述 三 个 条 件 
为 A* 算法 的 运行 条 件 。 

对 的 限制 可 以 更 正式 地 表述 如 下 。 令 h* 是 能 计算 出 任意 结 点 到 目标 的 最 优 代 
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价 的 函数 , 称 之 为 “完美 启发 函数 ”"。 如 果 YnCh(n) 三 h(n)), 则 称 为 可 采纳 的 启发 函 
数 (admissible heuristic function) ,或 者 称 h 是 可 采纳 的 ,简称 为 可 纳 的 。 此 外 ,我 们 也 引 
入 函数 g*, 它 能 计算 从 开始 结 点 到 任意 结 点 的 最 优 代价 。 定义 评 佑 函数 f*: 
00D 三 g”() 十 h* (mn)。 这 样 ,f* (mn) 就 是 从 起 始 结 点 出 发 经 过 结 点 n 到 达 目 标 结 点 的 
最 佳 路 径 的 总 代价 。 

把 估价 函数 fG) 和 f°* (mw) 相 比 较 ,g() 是 对 g*(n) 的 估价 ,hm) 是 对 hh* (n) 的 估价 。 
在 这 两 个 估价 中 ,尽管 g(z) 容 易 计算 ,但 它 不 一 定 就 是 从 起 始 结 点 Se 到 结 点 n 的 真正 的 
最 短路 径 的 代价 ,很 可 能 从 初始 结 点 Se 到 结 点 n 的 真正 最 短路 径 还 没有 找到 ,所 以 一 般 
都 有 g (2 过 85” (n)。 但 应 注意 ,A* 算法 的 步骤 (3) 和 (4) 保 证 了 如 果 发 现 n 的 更 好 的 
g () 值 , 则 以 此 值 作为 的 最 新 的 g(n), 并 相应 地 修改 的 父 指针 ,步骤 (4) 还 在 nn 已 被 
扩展 的 情况 下 将 nn 移 回 OPEN 表 , 使 得 n 会 被 再 次 扩展 。 

在 图 3-6 所 示 的 九宫 图 问题 中 ,尽管 并 不 知道 h* (n) 具 体 为 多 少 , 但 我 们 在 定义 
及 (0) 三 w(n) 时 ,保证 了 有 hh 的 可 采纳 性 。 这 是 因为 w(n) 统 计 的 是 “不 在 目标 状态 中 相应 位 
置 的 数码 个 数 ”, 这 相当 于 假定 把 不 在 目标 位 置 的 一 个 数码 移 到 它 的 目标 位 置 仅 需要 一 
步 ,而 实际 情况 下 把 一 个 数码 移 到 目标 位 置 应 该 需要 一 步 以 上 。 所 以 ,w(n) 必 然 不 大 于 
hh" (n)。 应 当 指 出 ,同一 问题 启发 函数 h(n) 可 以 有 多 种 设计 方法 。 在 九宫 图 问题 中 ,还 可 
以 定义 启发 函数 hm) 二 p(n) ,其 中 p(n) 为 结 点 的 每 一 数码 与 其 目标 位 置 之 间 的 欧 几 
里 得 距离 总 和 。 显 然 有 p(n) 三 h" (n), 相 应 的 搜索 过 程 也 是 A" 算法。 然而 ,p(n) 比 
w(n) 有 更 强 的 启发 性 信息 ,因为 由 hn) 二 p(n) 构 造 的 启发 式 搜索 树 , 比 由 hn) 二 wn) 
构造 的 启发 式 搜索 树 结 点 数 要 少 。 这 一 结论 在 后 面 关于 A* 算法 特性 的 讨论 中 说 明 。 

现在 给 出 一 些 关 于 算法 性 质 的 定义 ,为 了 叙述 方便 ,我 们 将 一 个 算法 记 作 M。 

完备 性 : 如 果 存 在 解 , 则 M 一 定 能 找到 该 解 并 停止 , 则 称 M 是 完备 的 。 

可 纳 性 : 如 果 存 在 解 , 则 M 一 定 能 找到 最 优 的 解 , 则 称 M 是 可 纳 的 。 

优越 性 (dominance) : 一 个 算法 Mi 称 为 优越 于 另 一 个 算法 M: , 指 的 是 如 果 一 个 结 点 
由 Mi 扩展 , 则 它 也 会 被 Ms 扩展 , 即 Mi 扩展 的 结 点 集 是 Ms 扩展 的 结 点 集 的 子 集 。 

最 优 性 : 在 一 组 算法 中 ,一 个 算法 M 称 为 最 优 的 ,如 果 M 比 其 他 算法 都 优越 。 

下 面 的 定理 3. 1 说 明了 A* 算法 的 完备 性 和 可 纳 性 。 为 了 证 明 该 定理 ,首先 介绍 引 
理 3.1。 

引 理 3.1 在 A’ 算法 停止 之 前 的 每 次 结 点 扩展 前 ,在 OPEN 表 上 总 是 存在 具有 如 
下 性 质 的 结 点 n* 。 

(a) n’ 位 于 一 条 解 路 径 上 。 

(b) A' 算 法 已 得 出 从 初始 结 点 5S。 到 n 的 最 优 路 径 。 

Ce) fa’ JEF* (56). 

证 明 : 为 证 明 此 引 理 在 A* 算 法 的 每 次 结 点 扩展 前 都 成 立 , 只 需 证 明 (1) 和 (2)。 

(1) 本 引 理 在 A* 算法 初始 执行 时 成 立 。 

(2) 若 本 引 理 在 一 个 结 点 被 扩展 之 前 成 立 , 则 在 该 结 点 被 扩展 之 后 本 引 理 同样 成 立 。 

按照 此 思路 ,将 采用 归纳 法 进行 证 明 。 为 叙述 方便 ,以 下 简称 A* 算法 为 A* 。 

归纳 基础 : A* 算 法 在 第 1 次 结 点 扩展 前 ( 即 So 被 选择 进行 扩展 之 前 ),S。 在 OPEN 
表 中 ,So 位 于 一 条 最 优 解 路 径 上 (因为 所 有 的 解 路 径 都 以 为 S。 起 点 ), 并 且 A’ 已 得 知 从 
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So 到 So 的 最 优 路 径 。 此 外 ,根据 f 的 定义 ， 
f(S0)= g(S0) +h(So) 
= h(So) 
hh (Su) 
= g* (So) 十 (So) 
三 广 (S) 

因此 ,在 第 1 次 结 点 扩展 前 ,S。 就 是 满足 引 理 结论 的 n”。 

归纳 步骤 : 假设 引 理 在 第 m 次 (m 宇 0) 结 点 扩展 后 成 立 ,证 明 本 引 理 在 第 mm 十 1 次 结 
点 扩展 后 仍 成 立 。 

假定 A* 算法 在 扩展 m 个 结 点 后 ,OPEN 表 中 存在 一 个 结 点 n" ,A* 算法 已 知 从 So 
到 和 的 最 优 路 径 。 那 么 , 若 关 在 第 六 十 1 次 扩展 中 未 被 选择 , 则 它 在 第 w 十 1 次 扩展 后 
是 满足 引 理 要 求 的 结 点 n* ,在 此 情况 下 引 理 得 证 。 另 一 方面 , 若 交 在 第 六 十 1 次 扩展 时 
被 选择 , 则 n* 的 每 一 个 未 在 OPEN 表 和 CLOSED 表 中 出 现 的 子 结 点 都 将 被 放 入 OPEN 
表 , 而 且 , 这 些 新 的 子 结 点 中 必然 存在 一 个 结 点 ( 记 为 n, ) 位 于 最 优 解 路 径 上 (因为 经 过 
n" 的 最 优 解 路 径 必然 在 经 过 n* 后 再 经 过 n* 的 某 个 子 结 点 ,所 以 ns 必然 存在 )。n 也 满 
足 条 件 (b), 即 A 已 得 出 从 So 到 nj, 的 最 优 路 径 , 该 路 径 记 为 Pi : 由 到 达 n* 的 最 优 路 径 
再 连接 上 n' 到 ns 的 有 向 边 而 组 成 。 如 果 从 Su 到 达 nn, 的 最 优 路 径 不 同 于 P,, 则 Pi 不 
构成 最 优 解 路 径 , 从 而 与 na 在 最 优 解 路 径 上 的 假设 相 了 矛盾。 因此 ,zs 满足 (a) 和 (b)。 下 
面 还 需 证 明 性 质 (c) 在 所 有 归纳 步骤 中 成 立 。 

我 们 将 证 明 性 质 (c) 在 A* 停止 前 的 0~m 次 扩展 时 都 成 立 。 

对 于 任 一 结 点 n" (2 在 最 优 解 路 径 上 , 且 A 算法 已 得 出 从 So 到 n* 的 最 优 路 径 , 即 
gln" ) 二 g" (n" )), 它 满足 如 下 不 等 式 。 

fn )= g(n" )+h(n’) 
gn’)+h’ (n’) 
0 
a 

因此 ,性 质 (c) 成 立 。 至 此 ,本 引 理 得 证 。 

定理 3.1 车 A* 算 法 的 运行 条 件 成 立 ,并 且 搜 索 空间 中 存在 从 初始 结 点 So 到 目标 
结 点 的 代价 有 穷 的 路 径 , 则 A* 算法 保证 停止 并 得 出 S。 到 目标 结 点 的 最 优 代价 路 径 。 

从 以 上 分 析 可 见 , 启 发 函数 的 性 质 影响 A* 算法 的 可 纳 性 。 实 际 上 ,h 还 影响 A* 算法 
的 结 点 扩展 数目 和 实现 细节 。 对 于 两 个 可 纳 的 启发 函数 hh 和 hs, 如 果 任 一 结 点 都 满足 
有 (7) 二 hz (n), 则 称 hs 的 信息 量 大 于 h,。 当 A’ 算法 使 用 信息 量 大 的 启发 函数 时 ,其 扩展 的 
结 点 数目 要 少 , 表 现 出 “优越 性 ”。 另 一 方面 ,如 果 启 发 函数 具有 “单调 性 ”, 则 A* 算法 不 必 在 
重复 访问 一 个 结 点 时 修改 该 结 点 的 父 指针 。 相 应 的 讨论 可 见 参 考 文献 [34]。 

在 A’ 算法 中 计算 时 间 不 是 主要 的 限制 。 由 于 A* 算法 把 所 有 生成 的 结 点 保存 在 内 
存 中 ,所 以 A* 算法 在 耗 尽 计算 时 间 之 前 一 般 早已 经 把 存储 空间 耗 尽 了 。 因 此 ,目前 开发 
了 一 些 新 的 算法 ,它们 的 目的 是 为 了 克服 空间 问题 ,但 一 般 不 满足 最 优 性 或 完备 性 ,如 选 
代 加 深 A* 算 法 (IDA* )、 简 化 内 存 受 限 A 算法 (SMA" ) 等 。 下 面 简单 介绍 IDA ”算法 。 
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3.3.5 ”和 壕 代 加 深 A* 算 法 


前 面 已 经 讨论 了 和 迭代 加 深 搜 索 算 法 , 它 以 深度 优先 的 方式 在 有 限制 的 深度 内 搜索 目 
标 结 点 。 该 算法 在 每 个 深度 上 都 检查 目标 结 点 是 否 出 现 ,如 果 出 现 , 则 停止 ,否则 深度 加 
1 继续 搜索 。 而 A "算法 是 选择 具有 最 小 估价 函数 值 的 结 点 扩展 。 下 面 给 出 的 迭代 加 深 
A" 搜索 算法 (IDA* ) 是 上 述 两 种 算法 的 结合 。 这 里 启发 式 函 数 用 作 深 度 的 限制 ,而 不 是 
选择 扩展 结 点 的 排序 。IDA* 算法 如 下 。 


Procedure IDA* 
Begin 
初始 化 当前 的 深度 限制 c =1; 
把 初始 结 点 压 人 栈 ;并 假定 <=cc; 
While 栈 不 空 Do 
Begin 
弹出 栈 项 元 素 n 
If n=goal, Then 结束 ,返回 n 以 及 从 初始 结 点 到 n 的 路 径 
Else 
Begin 
For n 的 每 个 子 结 点 n Do 
Begin 
IfEF (nm ) 反 czhen 把 mn 压 人 栈 
Else c=min(cd,f(n)) 
End 
End 
End 
IE 栈 为 空 并 且 c=cc ,Then 停止 并 退出 ; 
IE 栈 为 空 并 且 c 关 cc ,mhen c=c ,并 返回 2 
End 


上 述 算 法 涉及 了 两 个 深度 限制 。 如 果 栈 中 所 含 结 点 的 所 有 子 结 点 的 了 值 都 小 于 限 
制 值 c , 则 把 这 些 子 结 点 压 人 栈 中 ,以 满足 迭代 加 深 算法 的 深度 优先 准则 。 然 而 ,如 果 不 
是 这 样 , 即 结 点 的 一 个 或 多 个 子 结 点 的 了 值 大 于 限制 值 c, 则 结 点 的 co 值 设置 为 = 
min(c ,/ (n))。 该 算法 停止 的 条 件 为 : 找到 目标 结 点 (成 功 结束 ); @ 栈 为 空 并 且 限 
制 值 "一 “< 。 

IDA 算法 和 A’ 算法 相 比 ,主要 优点 是 对 于 内 存 的 需求 。A* 算法 需要 指数 级 数量 
的 存储 空间 ,因为 没有 限制 搜索 深度 。 而 IDA* 算法 只 有 当 结 点 n 的 所 有 子 结 点 的 
fn) 小 于 限制 值 c 时 才 扩 展 它 , 这 样 就 可 以 节省 大 量 的 内 存 。 另 一 个 问题 是 , 当 启 发 式 
函数 是 最 优 的 时 候 ,IDA* 算法 和 A 算法 扩展 相同 的 结 点 ,并 且 可 以 找到 最 优 路 径 。 


3.4 ”问题 归 约 和 AND-OR 图 启发 式 搜索 


启发 式 搜索 可 以 应 用 的 第 二 个 问题 是 AND-OR 图 的 反 向 推理 问题 。AND-OR 图 的 
反 向 推理 过 程 可 以 表示 一 个 问题 归 约 过 程 。 问 题 规约 的 基本 思想 是 : 在 问题 求解 过 程 
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中 ,将 一 个 大 的 问题 变换 成 若干 个 子 问题 ,再 将 这 些 子 问 题 分 解 成 更 小 的 子 问 题 , 这 样 继 
续 分 解 ,直到 所 有 的 子 问题 都 能 被 直接 求解 为 止 。 问 题 规约 方法 之 所 以 可 行 , 是 因为 我 们 
根据 全 部 子 问题 的 解 就 能 构造 出 原 问 题 的 解 。 一 般 地 , 待 求解 的 问题 称 为 初始 问题 ,能 直 
接 求解 的 问题 称 为 本 原 问题 。 


3.4.1 问题 归 约 的 描述 


首先 以 一 个 自动 推理 的 例子 介绍 基于 问题 归 约 思想 求解 问题 的 过 程 。 

例 3.1 给 定 如 下 一 组 命题 公式 ,给 出 证 明 命题 ~ 成立 的 证 明 序列 。 

{prtspAt>q, p>m,s>q,g >r}.。 

解 : 该 问题 的 解 是 这 样 一 个 证 明 序 列 : p,t,pAti>q,g 习 r。 那 么 ,如 何 得 到 这 个 解 ? 
可 以 采用 正 向 的 思考 ,也 可 以 采用 反 向 的 思考 。 

正 向 思考 过 程 通常 如 下 : 根据 p 和 p 一 m 得 出 m 成 立 , 根 据 p,t 和 pAi>g 得 出 gq 
成 立 ,根据 4 成 立 和 gr 得 出 x 成立。 基于 此 过 程 ,构造 出 证 明 序列 。 

反 向 思考 过 程 通常 如 下 : 若 要 证 明 x 成立, 就 必须 利用 能 推导 出 7 的 蕴涵 式 g 一 r; 进 
而 要 证 明 g 成 立 , 可 以 利用 蕴涵 式 ;一 gq 或 者 pA 人 4>g; 如 果 利 用 蕴涵 式 ;一 g, 则 要 证 明 s 
成 立 , 但 给 出 的 公式 集合 中 不 含 ;, 而 且 也 不 含 后 件 为 : 的 蕴涵 式 ,所 以 此 条 路 径 不 通 ;如 
果 利 用 pA4>g 证 明 g 成 立 , 则 要 求 p 和 1 都 成 立 , 由 于 p 和 都 在 给 定 的 公式 集中 存在 ， 
所 以 无 须 继续 证 明 。 至 此 ,能 够 构造 出 证 明 序列 。 

在 此 例 中 , 反 向 思考 的 过 程 就 是 问题 归 约 的 思想 。 例 如 ,将 “证 明成 立 ” 的 问题 通过 
蕴涵 式 gr 转化 为 “证 明 9 成 立 ” 的 问题 ;将 证明 g 成 立 ” 的 问题 通过 p 14>g 转化 为 
“证 明 p 成 立 ” 与 “证 明 1 成立 ”两 个 问题 ;* 证 明 p 成 立 ” 的 问题 由 于 p 在 命题 集合 中 存在 
而 能 被 立即 解决 ; 同 理 ,“ 证 明 1 成立” 的 问题 也 能 被 立即 解决 。 当 然 ,我 们 在 思考 过 程 中 
也 曾 尝试 过 将 “证 明 g 成 立 ” 的 问题 通过 ;>g 转化 为 “证 明 ;成立 ” 的 问题 ,在 发 现 “ 证 明 
成 立 ” 的 问题 无 法 解决 后 而 终止 这 个 方向 的 尝试 。 

正 向 思考 和 反 向 思考 在 效率 上 存在 差别 ,但 取决 于 具体 的 问题 ,没有 绝对 的 优 劣 之 
分 。 例 如 ,对 于 给 定 12,p->q,b 一 rp 一 s} ,要 证 明 成立, 则 应 用 反 向 思考 的 效率 高 ;对 
于 给 定 {p,t>s,r>s,p 阅 s) ,要 证 明 s 成 立 , 则 应 用 正 向 思考 的 效率 高 。 

下 面 介绍 基于 问题 归 约 思想 求解 问题 的 基本 概念 和 方法 。 从 问题 归 约 的 角度 ,一 个 
问题 表示 为 三 元 组 :(S。,O,P) ,其 中 

So 是 初始 问题 , 即 要 求解 的 问题 。 

卫 是 本 原 问 题 集 ,其 中 的 每 一 个 问题 是 不 用 证 明 的 ,自然 成 立 的 ,如 公理 ,已 知事 实 
等 ,或 已 证 明 过 的 问题 。 

O 是 操作 算 子 集 , 它 是 一 组 变换 规则 ,通过 一 个 操作 算 子 把 一 个 问题 转换 成 若干 个 子 
问题 。 

这 样 ,基于 问题 归 约 的 求解 方法 就 是 由 初始 问题 出 发 ,运用 操作 算 子 生成 一 些 子 问 
题 , 对 子 问题 再 运用 操作 算 子 生成 子 问题 的 子 问题 ,如 此 进行 到 产生 的 问题 均 为 本 原 问 题 
为 止 , 则 初始 问题 得 解 。 
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3.4.2 问题 的 AND-OR 图 表示 


我 们 用 一 种 图 表示 问题 归 约 为 子 问题 的 所 有 可 能 过 程 。 例 如 , 例 3. 1 的 问题 被 表示 
为 图 3-7, 其 中 ,方块 结 点 表示 问题 , 结 点 之 间 的 有 向 边 表示 源 结 
点 对 应 的 问题 可 分 解 为 目标 结 点 对 应 的 问题 。 例 如 ,有 向 弧 志 ,9 | 
表示 7 对 应 的 问题 可 以 分 解 为 g 对 应 的 问题 。 在 图 3-7 中 ,特殊 
的 是 结 点 g, 男 一 个 特殊 的 是 从 g 指向 p 和 4 的 有 向 边 。g 指向 p 2 











和 4 的 两 条 有 向 边 被 一 个 圆 弧 连 接 ,用 于 表示 g 被 分 解 ( 归 约 ) 为 
了 与 1: 只 有 当 p 和 4 对 应 的 问题 都 被 解决 时 ,gq 才能 被 解决 。 把 加 En le 
圆 弧 连 接 的 有 向 边 看 作 一 个 整体 ,把 有 向 边 ~g,m 二 看 作 另 一 个 ”图 3-7 问题 归 约 的 
整体 ,这 两 个 整体 表示 可 以 将 g 按照 前 一 个 整体 进行 分 解 ,或 者 ， 图 形 化 表示 
将 g 按照 后 一 个 整体 进行 分 解 。 

我 们 将 图 3-7 抽象 为 一 种 称 为 超 图 (hypergrah) 的 结构 ,用 二 元 组 (N, 矿 ) 表 示 : 其 中 
NN 为 结 点 的 有 穷 集合 ; 互 为 “ 超 边 ”(Hyperarce) 的 集合 ;一 个 超 边 表示 为 二 *,D 二 ,其 中 
sEN, 称 ;为 该 超 边 的 源 结 点 ,DSN, 称 D 为 该 超 边 的 目的 结 点 集 。 超 边 也 称 为 “连接 
符 ”(k-connector) ,其 中 人 一 | 了 |。 

例如 ,图 3-7 的 超 图 表示 为 : (Ni ,Hi),Ni={r,g,p,tsm} ,HT 一 {<r,(q) 二 ,到 q， 
{p, 二 ,gq,{m) 二 ), 其 中 : 超 边 <r,{g) 二 称 作 “1 连接 符 ”, 超 边 <<gq,{p,t} 二 称 作 “2 连 
接 符 ”。 可 以 看 出 ,普通 的 图 可 以 用 超 图 的 数学 形式 表示 ,因此 ,普通 图 是 超 图 的 特例 。 

从 问题 归 约 的 角度 看 ,一 个 问题 可 以 用 超 图 表示 其 中 所 有 的 问题 .问题 的 分 解 方法 。 
此 外 ,为 了 表示 本 原 问题 集合 .初始 问题 ,需要 再 增加 两 个 元 组 。 我 们 称 此 类 图 为 与 或 图 
(AND-OR 图 ) , 它 的 四 元 组 表示 为 CN,zo ,五 ,T) ,其 中 ， 

NN 是 结 点 集合 ,其 中 每 个 结 点 都 对 应 一 个 唯一 的 问题 。 

mw EN, 对 应 于 初始 问题 。 

瓦 是 超 边 的 集合 ,其 中 每 个 超 边 二 *,D> 二 都 表示 结 点 * 对 应 的 问题 的 一 个 可 行 的 分 
解 方法 。 若 1DI=1, 则 该 超 边 称 为 “或 弧 ”, 同 时 称 D 中 的 结 点 为 * 的 “或 子 结 点 ”(OR- 
node) ,也 称 它 为 的 “或 后 继 ?”(OR-descendents) ; 若 |D1 二 1, 则 该 超 边 称 为 “与 弧 ”, 同 时 
称 DD 中 的 结 点 为 的 “与 子 结 点 "(AND-node), 也 称 它们 为 ;的 “与 后 继 ”(AND- 
descendents) 。 

了 是 N 的 子 集 , 其 中 每 个 结 点 对 应 的 问题 都 为 本 原 问 题 ,T 中 的 结 点 也 称 为 叶 结 点 。 

与 或 图 (N ,no ,五 ,T) 的 每 个 以 no 为 根 结 点 的 子 图 都 可 以 表示 一 种 对 原始 问题 逐步 
分 解 的 过 程 。 例 如 ,图 3-8(a) 和 图 3-8(b) 分 别 是 图 3-7 的 两 个 不 同 的 子 图 ,其 中 子 图 3-8 
(a) 表 示 的 分 解 过 程 能 够 解决 原始 问题 ,我 们 称 这 样 的 图 为 与 或 图 (图 3-7) 的 解 图 ,而 子 
图 3-8(b) 表 示 的 分 解 过 程 不 能 解决 原始 问题 。 如 果 能 设计 一 种 算法 , 它 能 从 一 个 与 或 图 
中 找 出 性 质 如 3-8(a) 的 解 图 , 则 该 算法 就 为 我 们 找到 了 解决 原始 问题 的 一 个 分 解 过 程 。 
下 面 首先 提供 一 些 概 念 ,用 于 区 分 这 两 种 子 图 ,然后 讨论 用 于 搜索 解 图 的 算法 。 

下 面 首先 给 出 “可 解 结 点 ”(solved nodes) 和 “不 可 解 结 点 ”(unsolvable nodes) 的 概 
念 ,然后 定义 解 图 。 假 定 AND-OR 图 的 子 图 中 的 每 个 结 点 至 多 有 一 个 “k 连接 符 ”, 其 中 
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图 3-8 与 或 图 的 子 图 


的 一 个 “可 解 结 点 "递归 地 定义 如 下 。 

(1) 叶 结 点 是 可 解 结 点 。 

(2) 一 个 结 点 是 可 解 的 , 当 且 仅 当 以 它 为 源 结 点 的 某 一 条 “& 连接 符 ” 可 解 。 

(3) 一 个 上 连接 符 可 解 , 当 且 仅 当 该 连接 符 的 每 个 目的 结 点 都 可 解 。 

我 们 将 不 是 叶 结 点 的 结 点 简称 为 “ 非 叶 结 点 ”, 并 递归 定义 不 可 解 结 点 如 下 。 

(1) 无 后 继 的 非 叶 结 点 是 不 可 解 的 。 

(2) 一 个 结 点 是 不 可 解 的 , 当 且 仅 当 以 它 为 源 结 点 的 所 有 “连接 符 ? 都 不 可 解 。 

(3) 一 个 上 连接 符 是 不 可 解 的 , 当 且 仅 当 该 连接 符 存在 一 个 不 可 解 的 目的 结 点 。 

能 导致 初始 结 点 可 解 的 那些 可 解 结 点 及 相关 的 超 边 组 成 的 子 图 称 为 该 AND-OR 图 
的 解 图 。 

对 应 于 一 个 归 约 问题 的 AND-OR 图 可 能 有 多 个 解 图 ,那么 ,其 中 哪个 解 图 更 优 ? 为 
了 评价 解 图 的 优 劣 ,我 们 根据 归 约 问题 为 每 个 本 原 问 题 赋予 相应 的 权重 ,为 每 个 操作 算 子 
赋予 相应 的 权重 ,由 这 些 权重 表示 相应 的 费用 。 操 作 算 子 的 权重 一 般 用 于 表达 根据 子 结 
点 的 解构 造 出 父 结 点 的 解 的 费用 。 父 结 点 的 费用 定义 为 相应 的 操作 算 子 的 费用 与 子 结 点 
费用 之 和 。 一 个 解 图 的 费用 定义 为 该 图 中 初始 结 点 的 费用 。 基 于 以 上 概念 ,计算 一 个 归 
约 问题 的 最 优 解 的 问题 对 应 于 计算 该 问题 的 AND-OR 图 的 一 个 费用 最 小 的 解 图 的 问题 。 
通常 称 具有 最 小 费用 的 解 图 为 最 优 解 图 。 由 于 AND-OR 图 的 规模 巨大 ,所 以 我 们 仍然 采 
用 一 边 扩 展 AND-OR 图 ,一 边 进行 搜索 的 方法 。 为 了 将 搜索 过 程 引 向 能 发 现 最 优 解 图 的 
超 边 ,一 般 使 用 可 纳 的 启发 函数 估算 每 个 结 点 的 真实 费用 ,搜索 方向 总 是 偏向 于 启发 函数 

假设 任 一 结 点 n 到 目标 集 Se 的 费用 估计 为 h(n)。 结 点 的 费用 按 下 面 的 方法 
计算 。 

(1) 如 果 nE Se; 则 hn) 三 0, 否则 h(n) 为 以 n 为 源 结 点 的 & 连接 符 的 费用 的 最 小 值 。 

(2) 一 个 上 连接 符 过 n, {m,ns，… ,nm}) 的 费用 为 hn) 二 区 十 hCGn) 十 h(nz) 十 … 
hn) 


3.4.3 AO’* 算 法 


为 了 在 AND-OR 图 中 找到 最 优 解 图 ,需要 一 个 类 似 于 A* 的 算法 ,Nilsson 因而 提出 
了 称 为 AO* 的 算法 , 它 和 A’ 算法 是 不 同 的 ,其 主要 区 别 如 下 。 
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区 别 1: AO’ 算法 能 考虑 “与 弧 ” 的 费用 ,而 A* 算法 不 能 。 

为 和 弄 清 为 什么 A* 算法 不 足以 搜索 AND-OR 图 ,可 以 考察 如 图 3-9(a) 所 示 的 AND-OR 
图 。 扩 展 顶 点 A 产生 两 个 子 结 点 集合 ,一 个 为 结 点 B, 另 一 个 由 结 点 C.D 组 成 。 在 每 个 结 
点 旁边 的 数 表示 该 结 点 f 值 。 为 简单 起 见 , 假 定 对 应 于 连接 符 的 操作 算 子 的 费用 为 。 
若 采 用 A* 算法 考察 结 点 并 从 中 挑选 一 个 带 最 低 f 值 的 结 点 扩展 , 则 要 挑选 C。 但 根据 现 有 
信息 ,最 好 搜索 穿 过 B 的 那 条 路 径 , 因 扩展 C 也 得 扩展 了 ,其 总 耗费 为 9, 即 CD 十 C 十 2); 而 穿 
过 B 的 耗费 为 6。 问 题 在 于 下 一 步 要 扩展 结 点 的 选择 不 仅 依赖 于 该 结 点 的 了 值 ,而 且 取 决 
于 该 结 点 是 否 属于 从 初始 结 点 出 发 的 当前 最 短路 径 的 一 部 分 。 对 此 ,如 图 3-9(b) 所 示 的 
AND-OR 图 更 加 清楚 。 按 A* 算法 ,最 有 希望 的 结 点 是 G, 其 了 值 为 3。G 结 点 是 C 的 后 继 ， 
C 也 是 B.C.D 中 最 有 希望 的 结 点 ,其 总 耗费 为 9。 但 C 不 是 当前 最 优 路 径 的 一 部 分 , 因 用 C 
需 用 D, 而 DD 的 耗费 为 27。 因 此 不 应 扩展 G, 而 应 考虑 正和 下 。 

由 此 可 见 , 为 了 保证 搜索 到 一 个 最 优 解 图 ,在 搜索 AND-OR 图 时 ,每 步 需 做 三 件 事 : 

(1) 遍历 图 ,从 初始 结 点 开始 , 顺 沿 当 前 最 优 路 径 , 记 录 在 此 路 径 上 未 扩展 的 结 点 集 。 

(2) 从 这 些 未 扩展 结 点 中 选择 一 个 进行 扩展 。 将 其 后 继 结 点 加 入 图 中 ,计算 每 一 后 
继 结 点 的 / 值 (只 需 计 算 ,不 计算 g)。 

(3) 改变 最 新 扩展 结 点 的 / 估 值 ,以 反映 由 其 后 继 结 点 提供 的 新 信息 。 将 这 种 改变 
往 上 回 传 至 整个 图 。 在 往 后 回 传 时 ,每 到 一 个 结 点 就 判断 其 后 继 路 径 中 哪 一 条 最 有 希望 ， 
并 将 它 标记 为 目前 最 优 路 径 的 一 部 分 ,这 样 可 能 引起 目前 最 短路 径 的 变动 。 这 种 图 的 往 
上 回 传 以 修正 费用 估计 的 工作 在 A* 算法 中 是 不 必要 的 ,因为 A* 只 需 考 察 未 扩展 结 点 ， 
但 现在 必须 考察 已 扩展 结 点 ,以便 挑选 目前 的 最 优 路 径 。 
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下 面 通过 图 3-10 所 示 的 搜索 过 程 说 明 AO* 算法 的 基本 思想 。 

第 一 步 : A 是 唯一 结 点 ,因此 它 在 目前 最 优 路 径 的 末端 。 

第 二 步 : 扩展 A 后 得 结 点 B.C 和 ,因为 B 和 C 的 费用 为 9, 得 出 A 的 费用 为 6, 所 
以 把 到 D 的 路 径 标记 为 出 自 A 的 最 有 和 希望 的 路 径 (被 标记 的 路 径 在 图 中 用 箭头 指出 ) 。 

第 三 步 : 沿 着 最 有 希望 的 路 径 扩展 D, 得 到 和 下 的 与 弧 , 得 出 DD 的 费用 估计 为 10， 
故 将 DD 的 了 值 修改 为 10。 往 上 退 一 层 发 现 ,A 到 与 结 点 集 {B,C} 的 耗费 为 9, 所 以 ,从 A 
到 {B,C} 是 当前 最 有 希望 的 路 径 , 因 此 ,撤销 对 二 A,{D}) 二 的 标记 ,而 是 对 二 A,{B,C} 二 
进行 标记 。 

第 四 步 : 扩展 结 点 B, 得 结 点 G、 屯 , 且 它 们 的 费用 分 别 为 5、7。 往 上 传 其 了 值 后 ,B 
的 了 值 改 为 6( 因 为 G 的 弧 最 佳 )。 往 上 一 层 继 续 回 传 ,A 到 与 结 点 集 {B,C} 的 费用 更 新 


甸 3 葛 规 笑 六 一 141 


为 12, 即 (6 十 4 十 2)。 因 此 ,D 的 路 径 再 次 成 为 更 好 的 路 径 , 所 以 取消 二 A,{1B,C} 二 的 标 
记 , 再 次 标记 <A,{D}>。 


最 后 求 得 A 的 费用 为 : /(A) 二 min{12,4 十 4 十 2 十 1} 二 11。 
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图 3-10 一 个 AND-OR 图 的 搜索 过 程 


从 以 上 分 析 可 以 看 出 ,AND-OR 图 的 搜索 算法 由 两 个 过 程 组 成 。 

(1) 自 顶 向 下 , 沿 着 最 优 路 径 产 生 后 继 结 点 ,判断 结 点 是 否 可 解 。 

(2) 自 底 向 上 ,传播 结 点 是 否 可 解 ,做 估 值 修正 ,重新 选择 最 优 路 径 。 

区 别 2: 如 果 有 些 路 径 通 往 的 结 点 是 其 他 路 径 上 的 “与 ? 结 点 扩展 出 来 的 结 点 ,那么 不 
能 像 “ 或 ? 结 点 那样 只 考虑 从 结 点 到 结 点 的 个 别 路 径 , 有 时 候 路 径 长 一 些 可 能 会 更 好 。 

考虑 如 图 3-11(a) 所 示 的 例子 ,图 中 结 点 已 按 生 成 它们 的 顺序 给 了 序号 。 现 假定 下 一 
步 要 扩展 结 点 10, 其 后 继 结 点 之 一 为 结 点 5, 扩 展 后 的 结果 如 图 3-11(b) 所 示 。 到 结 点 5 
的 新 路 径 比 通过 3 到 5 的 先前 路 径 长 。 但 因为 若 要 经 由 结 点 3 而 通 向 结 点 5, 还 必须 解 
决 结 点 4, 而 结 点 4 是 不 可 解 结 点 ,所 以 经 由 结 点 10 而 通 向 结 点 5 的 路 径 更 好 。 
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(a) (b) 
图 3-11 长 路 径 和 短路 径 


AO* 算法 仅 能 求解 不 含 回路 的 与 或 图 。 做 这 种 限制 是 因为 可 解 的 归 约 问题 不 应 存 
在 回路 。 回 路 代表 了 一 条 循环 推理 链 。 例 如 ,在 证 明 数学 定理 时 会 出 现 如 图 3-12 所 示 的 
问题 , 即 能 证 Y 就 能 证 X ;同时 ,能 证 X 就 能 证 Y。 而 基于 这 样 的 回路 无 法 构造 出 X 或 者 
Y 的 证 明 。 因 此 ,AO* 算法 检测 并 忽略 回路 ,具体 的 做 法 为 
当 生成 结 点 A 的 一 个 后 继 结 点 B 并 发 现 B 已 在 图 中 时 ,就 [ 世 
检查 B 是 不 是 A 的 祖先 ; 仅 当 忆 不 是 A 的 祖先 时 , 才 把 最 近 图 3-12 循环 推理 
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发 现 的 到 B 的 路 径 加 到 图 中 。 

首先 介绍 AO "算法 的 主要 思想 。 在 A* 算法 中 用 了 两 张 表 : OPEN 表 和 CLOSED 
表 。AO' 算法 只 用 一 个 结构 G, 它 表达 了 至 今 已 明显 生成 的 部 分 搜索 图 。 图 中 ,每 一 结 
点 向 下 指向 其 直接 后 继 结 点 ,向 上 指向 其 直接 前 趋 结 点 。 同 图 中 每 一 结 点 有 关 的 还 有 
值 , 它 估 计 了 从 该 结 点 至 一 组 可 解 结 点 那 条 路 径 的 费用 。AO* 算法 还 使 用 一 个 称 为 
FUTILITY 的 值 。 若 一 解 的 估计 费用 大 于 FUTILITY 的 解 , 则 放弃 搜索 该 路 径 。 
FUTILITY 相当 于 一 个 阅 值 , 它 的 选择 应 使 得 大 于 费用 FUTILITY 的 任 一 解 即使 存在 ， 
也 因为 代价 大 而 无 法 使 用 。 下 面 介绍 具体 的 AO* 算法 。 


Procedure MO” 
Begin 
设 6 仅 由 代表 初始 问题 的 结 点 m 构成 ,计算 hm ) 。 
Repeat 
(a) 沿 着 从 m 开始 的 带 标记 的 大 连接 符 ,如 果 存 在 ,挑选 在 此 路 径 上 但 未 扩展 的 一 个 结 点 进行 
扩展 , 记 该 结 点 为 n。 
(b) 生 成 n 的 后 继 结 点 。 
If n 没 有 后 继 结 点 ,Then 令 h(n) =FUTILITY, 标 记 n 为 不 可 解 结 点 ; 
Else 
Begin 
记 n 的 后 继 结 点 集 为 suc, 
For 每 个 不 是 结 点 n 祖 先 的 后 继 结 点 sE suc,Do 
Begin 
(i) 把 = 加 到 图 6 中 。 
(ii 如 果 s 是 一 个 叶 结 点 , 则 将 标记 = 为 SoLVED, 并 令 h(s)=0。 
(iii) 若 s 是 非 叶 结 点 , 则 计算 它 的 b 值 。 
End 
End 
(c) 将 最 新 发 现 的 信息 向 上 回 传 ,具体 做 法 为 : 设 c 为 一 结 点 集 ,Cc 包括 已 经 做 了 sLOVED 标记 或 
者 hb 值 已 经 发 生 了 改变 的 结 点 。 将 C 初 始 化 为 {n}。 
(d)Repeat 
人 (从 c 中 挑选 一 个 结 点 ,该 结 点 在 6 中 的 子孙 均 不 在 c 中 出 现 贤 句 话说 ,保证 对 于 每 一 正在 
处 理 的 结 点 ,是 在 处 理 其 任 一 祖先 之 前 处 理 该 结 点 ), 称 此 结 点 为 c, 并 令 C=C - {cj。 
(ii 计算 以 c 为 源 结 点 的 每 条 连接 符 的 费用 ,其 费用 等 于 其 目的 结 点 的 b 值 之 和 加 上 
该 连接 符 自身 的 费用 。 从 刚刚 计算 过 的 始 于 c 的 所 有 连接 符 的 费用 中 选 出 极 小 费用 
作为 c 的 新 hb 值 。 
(iii) 把 在 (ii) 中 计算 出 来 的 带 极 小 费用 的 大 连接 符 标记 为 始 于 c 的 最 佳 路 径 。 
(iv) If c 的 带 标 记 的 连接 符 是 soLVED, 
Then 把 < 标记 为 SoLVED。 
(v) If c 已 标记 为 soLVED, 或 < 的 费用 刚才 已 经 改变 ， 
Then 应 把 其 新 状态 往 回 传 。 因 此 ,把 c< 的 所 有 祖先 结 点 加 到 c 中 。 
Until Cc 为 空 ; 
Until m 标 为 SOLVED (求解 成 功 ) ,或 mw 的 bh 值 大 于 FUTILITY (无 解 ); 
End 


由 此 可 以 看 出 ,AO* 算法 主要 由 两 个 循环 组 成 。 外 循环 包括 (a) 和 (b), 自 项 向 下 进 
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行 图 的 扩展 。 它 根据 标记 得 到 最 佳 的 局 部 解 图 ,挑选 一 个 非 叶 结 点 进行 扩展 ,对 它 的 后 继 
结 点 计算 h 值 并 进行 标记 更 新 。 内 循环 是 自 底 向 上 的 操作 (c) 和 (d) ,主要 进行 修改 费用 
值 . 标 记 连 接 符 、 标 记 SOLVED 操作 。 它 修改 被 扩展 结 点 的 费用 值 ,对 以 该 结 点 为 源 结 
点 的 连接 符 进 行 标记 ,并 修改 该 结 点 祖先 结 点 的 费用 值 。(d) 中 的 (iD 考察 的 结 点 在 G 
中 的 子孙 都 不 在 C 中 ,以 保证 修改 过 程 是 自 底 向 上 的 。 

下 面 根据 图 3-13 说 明 AO’ 算法 。 开 始 的 情况 下 ,在 算法 的 步骤 (c) 处 可 知 : C= 
{A)} ,在 步骤 Cd) 的 (D 步 可 知 : c=A。 由 于 有 A 到 {B,C} 的 连接 符 ,根据 该 连接 符 知 c 
的 费用 为 : 2 十 h(B) 十 h(C) 二 9; 另 外 有 A 到 {D}) 的 连接 符 , 根 据 该 连接 符 知 c 的 费用 
为 : 1 十 h(D)==6, 所 以 A 的 较 好 费用 为 6, 我 们 将 二 A,{D} 二 作 上 标记 。 这 样 ,在 下 一 次 
循环 的 步骤 (oa) 处 ,可 得 "一 D, 扩 展 了 D 后 得 : Suc 二 {EE,F) ,执行 之 后 的 步骤 得 到 也 的 新 
费用 为 10, 向 上 回 传 ,由 于 连接 符 二 A,{D} 二 的 新 费用 大 于 连接 符 二 A,{B,C} 二 的 费用 ， 
所 以 A 的 费用 更 新 为 连接 符 二 A,{B,C} 二 的 费用 ( 即 9) ,此 外 ,我 们 撤销 对 二 A,{D} 二 的 
标记 ,同时 对 二 A,{B,C}) 二 进行 标记 。 
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图 3-13 AO" 算法 耗 散 值 估计 的 向 上 传递 












































3.5 博弈 


博弈 一 向 被 认为 是 富有 挑战 性 的 智力 活动 ,如 下 棋 、 打 牌 、 作 战 、 游 戏 等 。 这 里 讲 的 博 
弈 是 二 人 博弈 ,二 人 零 和 、 全 信息 , 非 偶 然 博 弈 ,博弈 双方 的 利益 是 完全 对 立 的 。 

(1) 对 侄 的 双方 MAX 和 MIN 轮流 采取 行动 ,博弈 的 结果 只 能 有 3 种 情况 : MAX 
胜 .MIN 败 ;MAX 败 ,MIN 胜 ;和 局 。 如 果 记 “胜利 ”为 十 1 分 必 失 败 ? 为 一 1 分 ,“ 平 局 ”为 
0 分 , 则 双方 在 博弈 结束 时 的 总 分 总 是 为 “ 零 ”, 称 此 类 博弈 为 “ 零 和 ”。 

(2)“ 全 信息 ?是 指 : 对 弈 过 程 中 ,任何 一 方 都 了 解 当前 的 格局 和 过 去 的 历史 。 

(3)“ 非 偶然 ?是 指 : 任何 一 方 都 根据 当前 的 实际 情况 采取 行动 ,选择 对 自己 最 有 利 
而 对 对 方 最 不 利 的 对 策 ,不 存在 “ 碰 运 气 ”( 如 掷 仍 子 ) 的 偶然 因素 。 

具有 以 上 特点 的 博弈 游戏 有 : 一 字 棋 、 象 棋 、 围 棋 等 。 

先 来 看 一 个 例子 ,假设 有 7 枚 钱币 , 任 一 选手 只 能 将 已 分 好 的 一 堆 钱币 分 成 两 堆 个 数 
不 等 的 钱币 ,两 位 选手 轮流 进行 ,直到 每 一 堆 都 只 有 一 个 或 两 个 钱币 不 能 再 分 为 止 , 哪 个 
选手 遇 到 不 能 再 分 的 情况 则 为 输 。 

用 数字 序列 加 上 一 个 说 明 表示 一 个 状态 ,其 中 数字 表示 不 同 堆 中 钱币 的 个 数 ,说 明 表 
示 下 一 步 由 谁 分 ,如 (7,MIN) 表 示 只 有 一 个 由 7 枚 钱币 组 成 的 堆 , 由 MIN 分 ,MIN 有 3 
种 可 供 选择 的 分 法 , 即 (6,1, MAX),(5,2, MAX),(4,3, MAX), 其 中 MAX 表示 另 一 选 
手 ,不 论 哪 一 种 方法 ,MAX 在 它 的 基础 上 再 做 符合 要 求 的 划分 ,整个 过 程 如 图 3-14 所 示 。 
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图 中 已 将 双方 可 能 的 方案 完全 表示 出 来 了 ,而 且 从 中 可 以 看 出 ,无 论 MIN 开始 时 怎么 走 ， 
MAX 总 可 以 获胜 ,取胜 的 策略 用 粗 箭 头 表 示 。 


(DMIN) 
(6G.LMAXJ (52.MAX) (3MAX) 
i 
SLIMIN) (4.2,DMIN) (322,MIN) G.3.LMIN) 
(4,1,1,1 ,MAX) G2LLMAD (2,2.2,LMAX) 
GL LMIN) (2,2,1,1,LMIN) 


(2,1,1,1,1,1,MAX) 
图 3-14 分 钱币 的 博弈 


实际 的 情况 没有 这 么 简单 ,对 任何 一 种 棋 ,我 们 都 不 可 能 枚 举 出 所 有 情况 ,因此 ,只 能 
模拟 人 “向 前 看 几 步 ”, 然 后 做 决策 ,决定 自己 走 哪 一 步 最 有 利 。 也 就 是 说 ,只 能 分 析出 几 
层 的 走 法 ,然后 按照 一 定 的 估算 方法 决定 走 哪 一 步 棋 。 

在 博弈 过 程 中 ,任何 一 方 都 希望 本 方 取得 胜利 。 因 此 , 当 某 一 方 当前 有 多 个 行动 方案 
可 选择 时 ,他 总 是 挑选 对 自己 最 有 利 而 对 对 方 最 不 利 的 行动 方案 。 此 时 ,如 果 我 们 站 在 
MAX 方 的 立场 上 , 则 可 供 MAX 方 选择 的 若干 行动 方案 间 是 “或 ”关系 ,因为 主动 权 在 
MAX 方 手 里 ,他 或 选择 这 个 行动 方案 ,或 选择 男 一 个 行动 方案 ,完全 由 MAX 方 自己 决 
定 。 当 MAX 方 选取 任 一 方案 走 了 一 步 后 , MIN 方 也 有 若干 个 可 供 选择 的 行动 方案 ,此 
时 这 些 行动 方案 对 MAX 方 来 说 它们 之 间 是 “与 ?关系 ,因为 这 时 主动 权 在 MIN 方 手 里 ， 
这 些 可 供 选择 的 行动 方案 中 的 任何 一 个 都 可 能 被 MIN 方 选中 ,MAX 方 必 须 应 付 所 有 可 
能 发 生 的 情况 。 

这 样 ,如 果 站 在 某 一 方 ( 如 MAX 方 , 即 MAX 要 取胜 ), 把 上 述 博弈 过 程 用 图 表示 出 
来 , 则 得 到 的 是 一 棵 * 与 或 树 ”。 描 述 博弈 过 程 的 与 或 树 称 为 博弈 树 , 它 有 如 下 特点 。 

(1) 博弈 的 初始 格局 是 初始 结 点 。 

(2) 在 博弈 树 中 ,或 ? 结 点 和 ”与 ? 结 点 是 逐 层 交 蔡 出 现 的 。 自 己 一 方 扩展 的 结 点 之 
间 是 “或 ?关系 ,对 方 扩展 的 结 点 之 间 是 “与 ?关系 。 双 方 轮流 扩展 结 点 。 

(3) 所 有 自己 一 方 获胜 的 终局 都 是 本 原 问题 ,相应 的 结 点 是 可 解 结 点 ;所 有 使 对 方 获 
胜 的 终局 都 被 认为 是 不 可 解 结 点 。 

在 人 工 智能 中 可 以 采用 搜索 方法 求解 博弈 问题 。 下 面 讨论 博弈 中 两 种 最 基本 的 搜索 
裔 法。 


3.5.1 极 大 极 小 过 程 


在 二 人 博弈 问题 中 ,为 了 从 众多 可 供 选 择 的 行动 方案 中 选 出 一 个 对 自己 最 有 利 的 行 
动 方案 ,需要 对 当前 的 情况 以 及 将 要 发 生 的 情况 进行 分 析 , 通 过 某 搜索 算法 从 中 选 出 最 优 
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的 走 步 。 在 博弈 问题 中 ,每 一 个 格局 可 供 选 择 的 行动 方案 都 有 很 多 ,因此 会 生成 十 分 庞大 
的 博弈 树 , 如 果 试 图 通过 直到 终局 的 与 或 树 搜索 而 得 到 最 好 的 一 步 棋 是 不 可 能 的 ,如 曾 有 
人 估计 ,西洋 跳棋 完整 的 博弈 树 约 有 10”" 个 结 点 。 

最 常 使 用 的 分 析 方 法 是 极 小 极 大 分 析 法 。 其 基本 思想 或 算法 是 : 

(1) 设 博 弈 的 双方 中 一 方 为 MAX , 另 一 方 为 MIN。 然 后 设计 算法 为 其 中 的 一 方 ( 如 
MAX) 寻 找 一 个 最 优 行动 方案 。 

(2) 为 了 找到 当前 的 最 优 行动 方案 ,需要 对 各 个 可 能 的 方案 所 产生 的 后 果 进 行 比较 ， 
具体 地 说 ,就 是 要 考虑 每 一 方案 实施 后 对 方 可 能 采取 的 所 有 行动 ,并 计算 可 能 的 得 分 。 

(3) 为 计算 得 分 ,需要 根据 问题 的 特性 信息 定义 一 个 估价 函数 ,用 来 估算 当前 博弈 树 
端 结 点 的 得 分 ,此 时 估算 出 的 得 分 称 为 静态 估 值 。 

(4) 当 末 端 结 点 的 估 值 计算 出 来 后 ,再 推算 出 父 结 点 的 得 分 ,推算 的 方法 是 : 对 “或 ” 
结 点 , 选 其 子 结 点 中 一 个 最 大 的 得 分 作为 父 结 点 的 得 分 ,这 是 为 了 使 自己 在 可 供 选择 的 方 
案 中 选 一 个 对 自己 最 有 利 的 方案 ;对 “与 ? 结 点 , 选 其 子 结 点 中 一 个 最 小 的 得 分 作为 父 结 点 
的 得 分 ,这 是 为 了 立足 于 最 坏 的 情况 。 这 样 计算 出 的 父 结 点 的 得 分 称 为 倒 推 值 。 

(5) 如 果 一 个 行动 方案 能 获得 较 大 的 倒 推 值 , 则 它 就 是 当前 最 好 的 行动 方案 。 

在 博弈 问题 中 ,每 一 个 格局 可 供 选 择 的 行动 方案 都 有 很 多 ,因此 会 生成 十 分 庞大 的 博 
弈 树 。 试 图 利用 完整 的 博弈 树 进 行 极 小 极 大 分 析 是 困难 的 。 可 行 的 办 法 是 只 生成 一 定 深 
度 的 博弈 树 ,然后 进行 极 小 极 大 分 析 , 找 出 当前 最 好 的 行动 方案 。 在 此 之 后 ,再 在 已 选 定 
的 分 枝 上 扩展 一 定 深 度 , 再 选 最 好 的 行动 方案 。 如 此 进行 下 去 ,直到 取得 胜 败 的 结果 为 
止 ,至 于 每 次 生成 博弈 树 的 深度 ,当然 是 越 大 越 好 ,但 由 于 受到 计算 机 存储 空间 的 限制 ,只 
好 根据 实际 情况 而 定 。 

图 3-15 所 示 是 向 前 看 两 步 , 共 四 层 的 博弈 树 , 用 口 表 示 MAX, 用 〇 表示 MIN , 端 结 
点 上 的 数字 表示 它 对 应 的 估价 函数 的 值 。 在 MIN 处 用 圆 弧 连接 ,用 0 表示 其 子 结 点 取 估 
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图 3-15 四 层 博 弈 树 


图 3-15 中 , 结 点 处 的 数字 在 端 结 点 是 估价 函数 的 值 ,通常 称 它 为 静态 值 ,在 MIN 处 
取 最 小 值 ,在 MAX 处 取 最 大 值 ,最 后 MAX 选择 箭头 方向 的 走 步 。 

下 面 利用 一 字 棋 具体 说 明 一 下 极 大 极 小 过 程 ,不 失 一 般 . 设 只 进行 两 层 , 即 每 方 只 走 
一 步 ( 实 际 上 ,多 看 一 步 将 增加 大 量 的 计算 和 存储 ) ,如 图 3-16 所 示 。 

估价 函数 eC(p) 规 定 如 下 。 
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图 3-16 ”一 字 棋 博弈 的 极 大 极 小 过 程 


(1) 若 格 局 p 对 任何 一 方 都 不 是 获胜 的 , 则 
e(p) 一 (所 有 空格 都 放 上 MAX 的 棋子 之 后 三 子 成 一 线 的 总 数 ) 一 
(所 有 空格 都 放 上 MIN 的 棋子 后 三 子 成 一 线 的 总 数 ) 
(2) 若 p 是 MAX 获胜 , 则 e(p)== 十 oo。 
(3) 车 p 是 MIN 获胜, 则 e(p)== 一 oo。 
因此 ,车 p 为 





就 有 eC(p)= 二 6 一 4=2, 其 中 X 表 示 MAX 方 ,O 〇 表示 MIN 方 。 
在 生成 后 继 结 点 时 ,可 以 利用 棋盘 的 对 称 性 ,省 略 了 从 对 称 上 看 是 相同 的 格局 。 
图 3-16 给 出 了 MAX 最 初 一 步 走 法 的 搜索 树 , 由 于 X 放 在 中 间 位 置 有 最 大 的 倒 推 
值 , 故 MAX 第 一 步 就 选择 它 。 
MAX 走 了 箭头 指向 的 一 步 ,如 MIN 将 棋子 走 在 Xx 的 上 方 , 得 到 


2 


下 面 MAX 就 从 这 个 格局 出 发 选择 一 步 , 做 法 与 图 3-11 类 似 ,直到 某 方 取胜 为 止 。 





3.5.2 Qa 一 PP 过程 


上 面 讨论 的 极 大 极 小 过 程 先生 成 一 棵 博弈 搜索 树 ,而 且 会 生成 规定 深度 内 的 所 有 结 
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点 ,然后 再 进行 估 值 的 倒 推 计算 ,这 样 使 得 生成 博弈 树 和 估计 值 的 倒 推 计算 两 个 过 程 完全 
分 离 ,因此 搜索 效率 较 低 。 如 果 能 边 生 成 博弈 树 , 边 进行 估 值 的 计算 , 则 可 不 必 生成 规定 
深度 内 的 所 有 结 点 ,以 减少 搜索 的 次 数 ,这 就 是 下 面 要 讨论 的 a 一 8 过程。 

a 一 8 过程 就 是 把 生成 后 继 和 倒 推 值 估计 结合 起 来 ,及 时 剪 掉 一 些 无 用 分 枝 ( 即 避免 
生成 无 用 分 枝 ) ,以 此 提高 算法 的 效率 。 下 面 仍 然 用 一 字 棋 进行 说 明 。 现 将 图 3-16 左边 
所 示 的 一 部 分 重 画 在 图 3-17 中 。 

前 面 的 过 程 实际 上 类 似 于 宽度 优先 搜索 ,将 每 层 格 局 均 生成 ,现在 用 深度 优先 搜索 处 
理 ,如 在 结 点 A 处 , 若 已 生成 5 个 子 结 点 ,并 且 A 处 的 倒 推 值 等 于 一 1, 我 们 将 此 下 界 叫 作 
MAX 结 点 的 a 值 , 即 a 宇 一 1。 现 在 轮 到 结 点 B, 产 生 它 的 第 一 后 继 结 点 C,C 的 静态 值 为 
一 1, 可 知 B 处 的 倒 推 值 才 一 1, 此 为 MIN 结 点 8 值 的 上 界 , 即 B 处 8 一 1, 这 样 B 结 点 最 
终 的 倒 推 值 可 能 小 于 一 1, 但 绝 不 可 能 大 于 一 1, 因 此 ,B 结 点 的 其 他 后 继 结 点 的 静态 值 不 
必 计 算 , 自 然 不 必 再 生成 ,反正 B 绝 不 会 比 A 好 ,所 以 通过 倒 推 值 的 比较 ,就 可 以 减少 搜 
索 的 工作 量 ,在 图 3-17 中 作为 MIN 结 点 B 的 8 值 小 于 等 于 B 的 前 辈 MAX 结 点 S 的 a 
值 ,从 而 B 的 其 他 后 继 结 点 可 以 不 必 再 生成 。 
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图 3-17 ”一 字 棋 博弈 的 w 一 5 过 程 





图 3-17 展示 了 B 值 小 于 等 于 父 结 点 的 a 值 时 的 情况 。 实 际 上 , 当 某 个 MIN 结 点 的 B 
值 不 大 于 它 的 先辈 的 MAX 结 点 (不 一 定 是 父 结 点 ) 的 a 值 时 ,MIN 结 点 就 可 以 停止 向 下 

同样 , 当 某 个 结 点 的 a 值 大 于 等 于 它 的 先辈 MIN 结 点 的 B 值 时 ,该 MAX 结 点 就 可 
以 停止 向 下 搜索 。 

通过 上 面 的 讨论 可 以 看 出 ,一 8 过 程 首 先 使 搜索 树 的 某 一 部 分 达到 最 大 深度 ,这 时 
计算 出 某 些 MAX 结 点 的 a 值 ,或 者 是 某 些 MIN 结 点 的 8 值 。 随 着 搜索 的 继续 ,不 断 修 
改 祖先 结 点 的 a 或 8 值 。 对 任 一 结 点 , 当 其 某 一 后 继 结 点 的 最 终 值 给 定时 ,就 可 以 确定 该 
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结 点 的 a 或 B 值 。 当 该 结 点 的 其 他 后 继 结 点 的 最 终 值 给 定时 ,就 可 以 对 该 结 点 的 a 或 B 
值 进行 修正 。 

注意 a、B 值 修改 有 如 下 规律 : DMAX 结 点 的 a 值 永 不 下 降 ; @MIN 结 点 的 B 值 永 
不 增加 。 

因此 ,可 以 利用 上 述 规律 进行 剪 枝 , 一 般 可 以 停止 对 某 个 结 点 搜索 , 即 剪 枝 的 规则 表 
述 如 下 。 

(1) 若 任何 MIN 结 点 的 B 值 小 于 或 等 于 任何 它 的 先辈 MAX 结 点 的 值 , 则 可 停止 
该 MIN 结 点 之 下 的 搜索 ,这 个 MIN 结 点 的 最 终 倒 推 值 即 为 它 已 得 到 的 8 值 。 该 值 与 真 
正 的 极 大 极 小 值 的 搜索 结果 的 倒 推 值 可 能 不 相同 ,但 是 对 开始 结 点 而 言 , 倒 推 值 是 相同 
的 ,使 用 它 选择 的 走 步 也 是 相同 的 。 

(2) 若 任何 MAX 结 点 的 a 值 大 于 或 等 于 它 的 MIN 先辈 结 点 的 8 值 , 则 可 以 停止 该 
MAX 结 点 之 下 的 搜索 ,这 个 MAX 结 点 处 的 倒 推 值 即 为 它 已 得 到 的 a 值 。 

当 满 足 规则 (1) 而 减少 了 搜索 时 ,我 们 说 进行 了 a 剪 枝 ; 当 满足 规则 (2) 而 减少 了 搜 
索 时 ,我 们 说 进行 了 8 剪 枝 。 保 存 c 和 有 值 ,并 且 一 旦 可 能 ,就 进行 剪 枝 的 整个 过 程 通 
常 称 为 一 8 过 程 , 当 初始 结 点 的 全 体 后 继 结 点 的 最 终 倒 推 值 全 部 给 出 时 ,上 述 过 程 便 
结束 。 在 搜索 深度 相同 的 条 件 下 ,采用 这 个 过 程 获 得 的 走 步 总 与 简单 的 极 大 极 小 过 程 
的 结果 是 相同 的 ,区 别 只 在 于 a 一 8 过 程 通常 只 用 少 得 多 的 搜索 便 可 以 找到 一 个 理想 的 

图 3-18 展示 了 a 一 8 过 程 的 一 个 应 用 。a 一 8 过 程 为 图 中 结 点 A、B、C、D 进行 了 前 枝 
(前 枝 处 用 双 横 杠 标 出 )。 实 际 上 ,凡是 被 减 去 的 部 分 ,在 搜索 时 是 不 生成 的 。 




















图 3-18 a 一 p 修 


a 一 B 过 程 的 搜索 效率 与 最 先生 成 的 结 点 的 a、8 值 和 最 终 倒 推 值 之 间 的 近似 程度 有 
关 。 初 始 结 点 最 终 倒 推 值 将 等 于 某 个 叶 结 点 的 静态 估 值 。 如 果 在 深度 优先 的 搜索 过 程 
中 ,第 一 次 就 碰 到 了 这 个 结 点 , 则 剪 枝 数量 大 ,搜索 效率 最 高 。 

假设 一 棵 树 的 深度 为 d, 且 每 个 非 叶 结 点 的 分 枝 系 数 为 了 8。 对 于 最 佳 情况 , 即 MIN 结 
点 先 扩展 出 最 小 估 值 的 后 继 结 点 , MAX 结 点 先 扩展 出 最 大 估 值 的 后 继 结 点 。 这 种 情况 
可 使 得 修剪 的 枝 数 最 大 。 设 叶 结 点 的 最 少 个 数 为 Ne, 则 有 : 

N=/2 1 4d 为 偶数 
gn d 为 奇数 

这 说 明 ,在 最 佳 情 况 下 ,a 一 8 搜索 生成 深度 为 d 的 叶 结 点 数目 大 约 相 当 于 极 大 极 小 
过 程 所 生成 的 深度 为 d/2 的 博弈 树 的 结 点 数 。 也 就 是 说 ,为 了 得 到 最 佳 的 走 步 ,一 8 过 
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程 只 需要 检测 0(2%? ) 结 点 ,而 不 是 极 大 极 小 过 程 的 0(22) 。 这 样 有 效 的 分 枝 系数 是 ,而 
不 是 0。 假设 国际 象棋 可 以 有 35 种 走 步 的 选择 , 则 现在 可 以 有 6 种 。 从 另 一 个 角度 看 ， 
在 相同 的 代价 下 ,一 8 过 程 向 前 看 的 走 步 数 是 极 大 极 小 过 程 向 前 看 的 走 步 数 的 两 倍 。 


3.5.3 效用 值 估计 方法 


在 博弈 树 上 ,能 进行 极 大 极 小 过 程 或 者 a 一 8 过程 的 前 提 是 我 们 的 搜索 探寻 到 了 树 的 
叶 结 点 ,从 而 拥有 信息 评估 内 部 的 非 叶 结 点 的 效用 , 即 每 个 结 点 的 效用 对 博弈 算法 是 至 关 
重要 的 。 对 于 规模 较 小 的 博弈 树 ,搜索 算法 或 许 能 在 时 间 和 存储 空间 的 允许 内 到 达 叶 结 
点 。 然 而 ,对 于 规模 较 大 的 博弈 树 ,或 者 受 限于 反应 时 间 ,或 者 受 限 于 存储 空间 ,搜索 算法 
无 法 探寻 到 叶 结 点 。 那 么 ,如 何在 这 些 限制 下 计算 (评估 ) 非 叶 结 点 的 效用 值 则 成 为 关键 
技术 问题 。 

当然 ,采用 一 组 规则 对 非 叶 结 点 的 效用 值 做 出 评估 也 可 实现 一 定 程度 的 智能 ,然而 ， 
其 智能 程度 通常 弱 于 经 验 丰 富 的 棋 手 。 较 有 效 的 方法 是 通过 不 断 观 察 棋 手 的 博弈 过 程 改 
进 评 估 。 如 胡 裕 靖 等 采用 增强 学 习 模 型 (enforcement learning) 建 模 扑 克 游 戏 中 对 手 的 博 
弈 策略 09 ,能 根据 对 手 博弈 案例 增多 而 动态 对 本 方 的 评估 进行 调整 。 因 为 增强 学 习 的 
模型 随 着 对 世界 观察 的 增多 而 趋 近 于 最 优 的 决策 ,该 方法 也 具有 根据 对 手 案例 增多 而 渐 
进 全 面 地 了 解 对手 的 能 力 。 最 近 较 成 功 的 一 种 状态 估 值 技术 是 AlphaGo 系列 系统 中 针 
对 国际 象棋 的 方法 ,结合 增强 学 习 和 深度 神经 网 络 (deep neural networks) 模 型 对 对 手 和 
棋局 进行 建 模 与 评估 ,实现 了 更 有 效 的 评估 。 

然而 ,博弈 问题 的 种 类 繁多 ,针对 一 种 博弈 问题 的 技术 不 一 定 具 有 通用 性 ,因而 对 博 
弈 状态 的 评估 方法 仍 是 广阔 的 研究 领域 。 


3.6 案例 分 析 








3.6.1 八 皇 后 问题 


在 皇后 问题 中 ,要 把 N 个 皇后 放 入 一 个 N XN 的 方 格 棋盘 中 ,并 保证 任意 两 个 皇后 
都 不 在 同一 行 , 同 一 列 或 同一 对 角 线 上 。 

解 : 

为 求解 该 问题 ,我 们 将 棋盘 上 的 行 和 列 定数 为 1 一 的 整数 。 为 给 对 角 线 定数 ,把 对 
角 线 分 为 两 类 ,使 得 根据 其 行 数 (row) 和 列 数 (column) 计 算出 的 一 个 类 型 和 一 个 数 能 唯 
一 地 确定 一 条 对 角 线 。 

Diagonal 王 N 十 column 一 row( 类 型 1) 

Diagonal 王 row 十 column 一 1( 类 型 2) 

如 果 把 项 部 作为 第 一 行 , 左 部 作 第 一 列 看 待 棋盘 ,那么 类 型 为 1 的 对 角 线 形状 像 ^\”， 
类 型 为 2 的 对 角 线 形状 像 */”。 例 如 ,在 一 个 4X4 的 棋盘 上 ,类 型 为 1 和 类 型 为 2 的 对 角 
线 定数 分 别 如 下 图 中 的 左 图 和 右 图 。 
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/* 下 面 是 求解 Y 皇 后 问题 的 程序 ,其 中 求解 5 皇后 问题 的 调用 格式 为 :ngqueens(5) .* / 


DOMRAINS 
queen=q(integer,integer) /* 放 了 皇后 的 位 置 用 一 个 行 数 和 一 个 列 数 表示 * / 
queens= queen* /x 多 个 放 皇 后 的 位 置 用 一 张 表 表示 * / 
freelist=integer * /* 某 行 某 列 或 某 对 角 线 未 放 皇 后 的 位 置 用 自由 表 表 示 * / 


board=board (queens, freelist, freelist, freelist, freelist) 
/* 棋盘 用 单个 对 象 表示 ,其 中 第 一 参量 为 盘 上 已 经 放 有 皇后 的 位 置 , 后 4 个 自由 表 参 量 分 别 
指出 类 型 1 的 自由 行 、 自 由 列 、 自 由 对 角 线 和 类 型 2 的 自由 对 角 线 。 例 如 ， 
board([], [1,2,3,4], [1,2,3,4], [1,2,3,4,5,6,7], [1,2,3,4,5,6,7]). 
是 一 个 没有 摆 放 皇后 的 4X 4 棋盘 ,而 下 面 是 放 了 一 个 皇后 的 棋盘 : 
board ([q(1,1)], [2,3,4], [2,3,4], [1,2,3,5,6,7], [2,3,4,5,6,7]). */ 
PREDICATES 
placeN (integer, board, board) 
Place a queen (integer,board,board) 
nqueens (integer) 
makelist (integer, freelist) 
findandremove (integer, freelist, freelist) 
CLAUSES 
nqueens (N) :— 
makelist (N,L),Diagonal=N* 2-1, 
makelist (Diagonal,LL), 
placeN (N,board ([] ,L,L,LL,LL),Final), 


write (Final). 


/* 本 谓词 一 次 摆 放 一 个 皇后 , 摆 到 无 自由 行 、 自 由 列 存在 时 终止 。* / 
PlaceN (_,board(D, [], [] ,D1,D2) ,board(D, [], [] ,D1,D2)):-! 
placeN (N, Boardl1, Result) :一 

place a queen (N,Boardl1,Board?) ,placeN (N,Board2,Result) . 


/* 本 谓词 一 次 摆 放 一 个 新 皇后 q(R,C) 加 到 已 经 摆好 的 皇后 表 Queens 中 。 为 此 ,需要 将 之 从 自由 
行 、 自 由 列 中 删 掉 。x*/ 
place a_queen (N,board (Queens, Row, Columns, Diagl, Diag?), 
board ([q (R,C) |Queens] ,NewR, NewC, NewD1, NewD2) ) :— 
findandremove (R, Rows, NewR) , 
findandremove (C, Columns, NewC), 
DI=N+ C-R, findandremove (D1, Diag], NewD1), 
D2=R+ C- 1, findandremove (D2, Diag?2, NewD2) . 
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/# 谓词 findandremove 从 第 二 参量 中 删除 第 一 参量 的 第 一 次 出 现 。* / 
findandremove (X, [X|Rest],Rest). 
findandremove (X, [X|Rest], [Y|Taill]):— 
findandremove (X, Rest, Tail). 


/* 对 于 任 一 整数 N, 谓 词 makelist 造 一 张 含 日 个 数 的 数 表 。 例 如 ,makelist (4,X) 的 结果 为 
X= [4,3,2,1]。 */ 
makelist (1, [1]). 
makelist (N, [N|Rest] :— 
N> 0,NI= N- 1,makelist (N1,Rest) . 


3.6.2 洞穴 探 宝 


传说 有 一 位 探险 家 听 人 说 在 一 个 洞穴 中 藏 着 大 量 金 银 财宝 ,以 前 曾 有 许多 人 试图 找 
出 这 些 财宝 ,可 劳 而 无 功 。 该 洞穴 是 一 个 地 下 长 廊 的 迷宫 (图 3-19) ,连接 着 各 种 不 同 的 
洞穴 ,其 中 有 些 洞 穴 住 有 鬼怪 和 山 盗 。 幸 好 财宝 都 在 同一 洞穴 中 。 现 问 : 哪 条 路 既 能 使 
那 位 探险 家 不 受到 伤害 ,又 能 找到 财宝 ? 采用 图 搜索 技术 ,编程 完成 这 个 任务 。 


洞穴 探 宝 地 图 









地 狱 (hell) 


强盗 
(robbers) 
关 人 鱼 


和 HD (entry) Cmermaid) 


出 口 


宝藏 (gold) (exit) 


妖怪 
(monsters) 


图 3-19 洞穴 探 宝地 图 


解 : 

可 用 TurboPROLOG 表达 上 面 这 张 地 图 ,以 帮助 找 出 一 条 安全 通路 ,每 条 通路 描述 
一 个 事实 ,规则 由 谓词 go 和 route 给 出 。 给 定 目标 如 下 。 

Goal:go (entry,exit) 

下 面 的 程序 将 回答 一 张 洞穴 表 , 穿 过 它们 能 找到 财宝 并 安全 返回 。 


DOMAINS 
room= symbol 
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roomlist=room* 


PREDICATES 


gallery (room, room) 
neighborroom (room, room) 
avoid (roomlist) 

go (room, room) 

route (room, room, roomlist) 
member (room, roomlist) 


CLAUSES 


gallery (entry,monsters) . 

gallery (entry, fountain). 

gallery (fountain, hell). 

gallery (fountain, food) . 

gallery (exit,gold treasure). 
gallery (fountain,mermaid). 
gallery (robbers,gold treasure). 
gallery (fountain, robbers). 
gallery (food, gold treasure). 
gallery (mermaid,exit). 

gallery (monsters, gold treasure). 
neighborroom(X,Y) if gallery (X,Y). 
neighborroom (X,Y) if gallery(Y,X) . 


avoid( [monsters, robbers]). 


/* 入 口 和 妖怪 之 间 有 一 条 通道 * / 
/* 人 口 和 喷泉 之 间 有 一 条 通道 * / 
/* 喷泉 和 地 狱 之 间 有 一 条 通道 * / 
/* 喷泉 和 食品 之 间 有 一 条 通道 * / 
/* 出 口 和 财宝 之 间 有 一 条 通道 * / 
/* 喷泉 和 美人 鱼 之 间 有 一 条 通道 * / 
/* 山 瓷 和 财宝 之 间 有 一 条 通道 * / 
/* 喷泉 和 山 盗 之 间 有 一 条 通道 * / 
/* 食品 和 财宝 之 间 有 一 条 通道 * / 


/* 在 美人 鱼 和 出 口 之 间 有 一 条 通道 * / 


/* 妖怪 和 财宝 之 间 有 一 条 通道 * / 
/* 通道 两 端的 洞穴 彼此 相 邻 * / 


/* 不 能 穿 过 妖怪 和 山 盗 的 洞穴 * / 


go (Here, There) if route (Here, There, [Here]) . ”/* 记录 已 穿 过 的 洞穴 ,以 后 不 能 回头 * / 
route (exit,exit,VisitedRoom) if 
member (gold treasure,VisitedRoom) and write (VisitedRoom)and nl. 
/* 若 走 到 洞穴 的 出 口 时 ,财宝 装 在 一 穿 过 的 洞穴 表 内 ,这 目标 已 经 达到 * / 
route (Room, Way_out,VisitedRoom) if 
neighborroom (Room, Nextroom) and avoid (DangerousRoom) and 
not (member (NextRoom, DangerousRoom)) and 
not (member (NextRoom, VisitedRoom) ) and 
route (NextRoom, Way_out, [NextRoom| VisitedRoom]). /* 试 穿 过 既 不 危险 ,又 未 访问 过 
的 下 一 洞穴 * / 
member (X, [XI_]) . 
member (X, [_|H])if member (X,H) - 


在 证 实 上 述 程序 确 能 找 出 目标 go(entry,exit) 的 解 后 ,可 新 加 一 些 通道 (如 gallery 
Cmermaid,gold_treasure) ) 以 及 (或 者 ) 其 他 应 该 避 开 的 危险 物 。 此 外 ,上 述 程序 只 能 给 出 
一 个 解 , 若 想 获得 全 部 解 , 则 需 通 过 在 route 的 第 一 条 规则 中 加 fail 的 方法 使 PROLOG 
在 找到 一 个 解 后 立即 回溯 。 

route (Room, Room, VisitedRooms) if 

memiber (gold treasure,VisitedRooms) and write (VisitedRooms)and nl and fail. 

可 用 表 打 印 谓词 write_a_list 显示 名 字 表 , 且 不 显示 方 括号 和 逗号 。 此 外 ,因为 搜集 
在 VisitedRooms 表 中 的 已 穿 过 洞穴 是 以 逆序 形式 排列 的 , 即 出 口 在 前 .入口 在 后 ,所 以 
write_a_list 要 做 转换 , 即 先 打印 表 尾 ,后 打印 表 头 。 
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3.6.3 五 子 棋 


五 子 棋 一 方 执 黑 子 ,一 方 执 白 子 , 轮 流行 棋 , 哪 方 无 论 横 线 、. 竖 线 , 还 是 斜 线 方向 , 先 连 
成 五 者 为 胜 。 这 里 规定 : 采用 国际 上 标准 的 15X 15 路 线 的 正方 形 棋盘 (图 3-20); 两 人 
(机 ) 分 别 执 黑白 两 色 棋 子 , 轮 流 在 棋盘 上 选择 一 个 无 子 的 交叉 点 走 子 ,无 子 的 交叉 点 又 称 
为 空 点 ;由 黑 方 先行 走 棋 。 给 出 五 子 棋 算 法 设计 及 主要 实现 技术 。 


Ei 






























































图 3-20 五 子 棋 棋 盘 及 格局 一 


解 : 

1. 静态 估计 与 贪心 算法 

五 子 棋 估 价 函数 用 于 评估 落 点 的 优 劣 。 估 价 函 数 没有 一 套 固定 的 设计 方法 , 它 的 设 
计 与 算法 设计 者 的 主观 经 验 有 很 大 关系 。 不 同 的 人 会 设计 出 不 同 的 估价 函数 ,下 面 给 出 
一 种 实现 方案 。 

对 于 棋盘 中 的 每 个 位 置 ,考虑 将 下 一 步 棋子 放 到 该 位 置 后 , 它 与 周围 的 棋子 连 成 什么 
样 的 棋 形 。 这 样 只 考虑 相连 的 五 个 位 置 就 可 以 了 ,这 里 称 五 元 组 。 估 价 函 数 要 做 的 就 是 
为 每 种 五 元 组 定 一 个 分 数 。 可 规定 : 

(1) 五 元 组 中 有 任意 个 对 方 棋 子 , 得 分 为 0。 

(2) 五 元 组 中 有 1 个 已 方 棋子 ,得 分 为 5。 

(3) 五 元 组 中 有 2 个 连续 已 方 棋子 ,得 分 为 50。 

(4) 五 元 组 中 有 3 个 连续 已 方 棋子 ,得 分 300。 

(5) 五 元 组 中 有 4 个 连续 已 方 棋子 ,得 分 1000。 

(6) 五 元 组 中 有 5 个 连续 已 方 棋子 ,得 分 10000 。 

对 于 棋盘 中 的 一 个 位 置 (z,y) ,考虑 横 、 竖 、 斜 和 反 斜 4 个 方向 ,(z,y) 最 多 属于 20 个 
五 元 组 , 令 h(x,y) 为 这 个 位 置 的 估价 分 数 , 则 h(xz,y) 为 (zx,y) 所 属 五 元 组 的 分 数 之 和 。 
这 样 , 求 出 棋盘 中 所 有 位 置 的 h(z,y), 选 出 一 个 分 值 最 大 的 位 置 作为 落 子 点 即 可 。 

在 前 3 子 落 子 后 ,计算 白 子 落 在 哪个 位 置 最 好 。 如 图 3-21 所 示 , 第 4 子 位 置 的 估价 
分 数 计算 如 下 : 5( 横 方向 ) 十 5X5( 竖 方向 ) 十 5 十 50X4( 斜 方向 ) 十 5X5( 反 斜 方向 ) 二 260 
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如 图 3-21 所 示 ,第 4 子 的 位 置 的 估价 分 数 计算 如 下 。 




















图 3-21 五 子 棋 格 局 二 


5X5( 横 方向 ) 十 5X2( 竖 方向 ) 十 5 十 50X4( 斜 方向 ) 十 5X5( 反 和 斜 方向 ) 一 265 

根据 以 上 估价 过 程 ,第 4 子 ( 白 子 ) 选 择 落 在 如 图 3-21 所 示 的 位 置 较 好 。 

这 种 行 棋 方 法 称 为 贪心 算法 。 由 于 是 将 人 类 思考 总 结 的 规律 直接 转 成 程序 ,使 得 贪 
心算 法 拥有 不 错 的 棋 力 。 但 是 ,只 考虑 了 一 步 的 情况 是 不 够 的 。 人 类 在 博弈 的 时 候 往往 
会 向 后 联想 几 步 再 做 决定 。 还 有 ,这 里 评判 优 劣 的 标准 比较 主观 ,有 些 人 认为 有 冲 四 ( 冲 
四 : 形成 某 方 4 子 相连 的 情形 ) 就 先 冲 四 ,有 人 则 认为 冲 四 要 留 在 后 面 。 

这 里 ,我们 用 了 如 下 方法 排序 。 

(1) 由 于 五 子 棋 以 五 子 相连 为 胜 , 因 此 一 个 已 有 子 周 围 的 点 是 较 有 威胁 的 点 ,而 且 最 
后 下 的 一 子 的 周围 点 威胁 性 更 大 。 可 将 它们 排 在 搜索 队列 前 面 , 优 先 搜 索 。 本 程序 中 在 
存储 棋子 的 栈 中 从 栈 顶 到 栈 底 ,依次 取 其 中 有 棋子 位 置 的 周围 24 个 点 作为 搜索 结 点 。 如 
图 3-22 所 示 , 黑 子 周围 的 24 个 空 点 就 是 优先 搜索 的 点 。 

(2) 对 一 些 特殊 棋 型 周围 的 点 ,如 图 3-23 中 的 四 和 四 空 点 ,它们 很 可 能 就 是 当前 局 
势 的 极 小 极 大 值 , 优 先 搜索 它们 ,可 以 减少 极 小 极 大 算法 的 搜索 量 。 





图 3-22 已 有 棋子 周围 优先 搜索 的 24 个 点 图 3-23 ”特殊 棋 型 周围 的 点 
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2. 进攻 与 防守 的 选择 
计算 机 程序 的 进攻 与 防守 策略 : 看 计算 机 最 大 的 值 与 玩家 最 大 的 值 哪个 大 ,如 果 计 
算 机 最 大 的 值 大 , 那 就 进攻 ,否则 就 防守 。 























主要 的 规则 评分 如 下 。 

(1) “OOOOO”—>50000 (2)“ 十 DOOO 十 ”一 4320 
KRCNOO 直 二 720 (十 十 DGGO 十 和 =720 
KOI 于 ”720 (6 OFOQOF™720 
《77 OOOGO 二 ”~720 (8) “十 DOOO"” 一 720 
(93 OOFOO>720 (10) “O+OOO”—=720 
COOOFO"=120 (12) 十 二 OOO 十 十 ">*120 
C13¥*# 丰 在 〇 十 〇 和牛 =z120 (Os120 
《6 站 三 十 品 十 古 220 (1694 生 刷 品 二 二 站 =520 














上 面 的 评分 是 计算 机 方 棋子 有 这 些 特征 ,给 正 分 。 如 果 是 对 手 有 这 些 特征 , 则 得 分 取 
反 , 得 负 分 。 例 如 ,对 手 如 果 有 “OOOOO” 特 征 , 将 得 一 50000 分 。 

为 了 求 局 势 总 分 / ,我们 先 求 第 i 路 得 分 有 (2): 有 (72) 二 hc6 让 十 hm(i) 
其 中 ,hc( 站 为 第 i 路 计算 机 方 总 得 分 ,hm( 站 为 第 i 路 对 手 总 得 分 。 

如 图 3-24 所 示 ,在 横 的 路 上 , 白 方 出 现 特征 (3), (我们 只 匹配 一 个 规则 ,因此 特征 (4) 


不 再 统计 ), 黑 方 出 现 特征 (12) ,因此 有 
hc (i) = 720;hm(i) 一 一 120 
h(i) = he(i)++ hm(i) = 720— 120 = 600 Ht 
棋盘 上 总 共有 72 路 (采用 15X15 的 棋盘 ,棋盘 图 3.24 局 势 特 征 示例 
的 每 一 条 线 称 为 一 路 ,包括 行列 和 和 斜 线 ,4 个 方向 ， 
其 中 行列 有 30 路 ,两 条 对 角 线 共 58 路 ,整个 棋盘 的 路 数 为 88 路 。 考 虑 到 五 子 棋 必 须要 
五 子 相 连 才 可 以 获胜 ,这 样 对 于 斜 线 , 可 以 减少 4X4 二 16 路 , 即 有 效 的 棋盘 路 数 为 72 


路 ) ,所 以 局 势 的 总 得 分 为 














f= Dn) 
3. 改进 的 搜索 技术 
初版 程序 中 主要 采用 极 小 极 大 搜索 加 静态 估 值 技术 ,实践 中 达到 了 比 初学 者 强 的 水 
平 ,一 些 比较 熟练 的 业余 人 员 时 常 也 会 输 于 此 程序 。 
由 于 初版 程序 中 采用 固定 的 估 值 法 ,为 设计 这 个 估 值 函数 ,要 求 设计 人 员 对 下 棋 的 方 
法 有 较 多 的 了 解 , 能 充分 判断 棋局 局 面 中 的 某 一 特征 在 形势 判断 中 起 的 重要 程度 ( 即 相 应 
的 分 值 ) ,并 给 整个 局 面 比较 准确 的 评分 。 但 是 , 面 对 成 千 上 万 的 局 面 ,即使 是 大 师 , 也 不 
可 能 一 一 做 出 精确 的 形势 判断 ,特别 是 在 对 局 的 开始 阶段 ,棋局 的 优 劣 更 难以 判断 。 而 
且 , 如 果 对 大 量 的 棋局 状态 进行 存储 ,就 要 求 有 大 的 存储 空间 及 快速 的 搜索 算法 。 因 此 ， 
静态 的 估 值 函数 不 可 能 有 很 大 的 准确 性 。 估 值 的 不 准确 使 其 "智力 ? 较 低 ,而 且 固定 的 赋 
值 方式 使 其 估 值 准确 度 不 能 通过 学 习 改善 “智力 ?也 就 不 能 提高 。 通 过 对 搜索 算法 的 优 
化 与 修正 ,特别 是 针对 五 子 棋 本 身 对 弈 的 特点 和 规律 ,采用 置换 表 搜索 与 威胁 空间 搜索 相 
结合 的 搜索 技术 (参考 : Alus, L V, and M P H Huntjens. “GO-MOKU SOLVED BY 








156 人 工 乔 能 ( 荔 了 版 ) 


NEW SEARCH TECHNIQUES. ”Computational Intelligence 12. 1 (1996): 7-23) ,可 显 
著 提高 五 子 棋 程 序 对 弈 的 水 平和 能 力 。 

4. 五 子 棋 实现 

为 了 体现 模块 化 思想 ,定义 了 五 子 棋 游 戏 类 CGame, 封 装 了 用 于 处 理 五 子 棋 游 戏 中 
各 类 操作 的 函数 。 在 对 话 框 类 中 定义 CGame 类 的 一 个 对 象 调 用 类 中 的 成 员 函 数 。 五 子 
棋 类 的 私有 成 员 定义 了 一 些 重要 的 行 棋 信 息 , 公 有 成 员 定义 了 各 种 操作 和 实现 某 一 特定 
功能 的 函数 。 


class CGame 
{ 
public: 
CGame (); // 构 造 函 数 
virtual ~ CGame () 7 // 析 构 函 数 
void DrawChessBoard (CDC * pDC); // 画 棋盘 
void SetWhoFirst (bool); // 设 置 先 走 方 
bool GetWhoFirst (); // 获 得 先 走 方 
void BeginGame (); // 开 始 游戏 bool IsPlaying(); 
// 判 断 游 戏 是 否 正在 进行 中 
void SetWhoTurn (bool); // 交 换 走 棋 方 
bool GetWhomTurn () // 获 得 走 棋 方 
bool DownChess (CDC * pDC, CPoint point); // 落 子 
bool DrawChess (CDC * pDC, CPoint point); // 画 棋子 
bool InsideBoard (int x, int y); // 判 断 是 否 在 棋盘 范围 内 
void CheckBoardstyle (); // 判 断 棋 形 
int GetScore (int c); // 评 分 
double DFS (int who, int color, int depth, int nowVal); // 极 大 极 小 搜索 
void ComputerThink (POINT&Point) ; // 计 算 机 思考 
int CheckWin (); // 判 断 输 赢 
void GameOver (); // 游 戏 结束 
bool Huioi (); // 悔 棋 
bool GetLastPoint (POINT&point) ; // 获 得 最 后 下 棋 点 位 置 
bool iszero (int ivint j); // 判 断 该 点 是 否 是 0 
void SetGrade (int depth, int width); // 设 置 难度 


Private: 


bool m Who First; 


// 谁 先 走 棋 :0 手 机 ,1 人 


bool m Who_Turn; // 轮 到 哪 方 走 棋 
bool m Playing; // 游 戏 中 
int Board[15] [15] ,BV[15] [15]; // 棋 盘 ,0 空 ,1 黑 ,2 白 


int Bstyle[2] [15] [15] [8] [2]; 
int Score[15][15],Sc[2] [15] [15]; 
struct Point{ 
int x, y, val; 
}stack[256]; 
struct CP{ 


bool operator () (Point pl, Point p2) 


//0 黑 1 白 ;x;y; 方 向 ;0 空 ,1 棋 
// 分 值 表 


// 保 存 一 下 棋 位 置 的 栈 
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return pl.val>p2.val; 
} 
};int m top; // 栈 顶 
int m depth,m widthy // 搜 索 深 度 和 宽度 
]7 


五 子 棋 对 弈 界面 ,如 图 3-25 和 图 3-26 所 示 。 


































































































图 3-25 人 与 计算 机 对 弈 一 一 游戏 进行 中 
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图 3-26 人 与 计算 机 对 弈 一 一 黑 棋 获胜 
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习题 


3.1 


3.4 


农夫 和 狼 、 羊 、 菜 问题 。 一 个 农夫 带 着 一 只 狼 , 一 只 羊 和 一 黎 菜 , 欲 从 河 的 左岸 坐 船 

到 右岸 ,由 于 船 太 小 ,农夫 每 次 只 能 带 一 样 东西 过 河 , 并 且 没 有 农夫 看 管 , 狼 会 吃 羊 ， 

羊 会 吃 菜 。 设 计 一 个 方案 ,使 农夫 可 以 无 损失 地 渡 过 河 。 

九宫 图 问题 。 设 启发 函数 为 未 归 位 数码 的 个 数 , 初 始 状 态 和 目标 状态 如 图 3-3 所 

示 , 试 用 局 部 择优 和 全 局 择优 方法 分 别 画 出 启发 式 搜索 图 。 

考虑 起 始 状 态 为 1 .每 个 状态 上 都 有 两 个 后 继 2k 和 2k 十 1 的 状态 空间 。 

(1) 画 出 1 一 15 的 状态 空间 。 

(2) 假设 目标 状态 为 11。 请 列 出 访问 结 点 的 顺序 : 宽度 优先 搜索 深度 界限 为 3 的 
深度 受 限 搜索 .迭代 加 深 搜 索 。 

(3) 双向 搜索 求解 此 问题 有 优势 吗 ? 两 种 方向 的 分 支 因子 分 别 是 多 少 ? 

(4) 对 提问 (3) 的 解答 是 否 提示 我 们 可 对 这 个 搜索 问题 重新 进行 形式 化 ,以 使 从 状 
态 1 到 任意 目标 状态 的 问题 求解 不 需要 搜索 ? 

(5) 从 k 到 2k 的 操作 记 为 Left, 从 & 到 2k 十 1 的 操作 记 为 Right。 试 给 出 不 需 搜索 
就 能 完成 求解 的 算法 。 

图 3-27 所 示 是 铁路 积木 组 合 ,其 下 标明 的 数字 为 积木 块 数 ,弯曲 块 和 开 叉 块 可 以 双 

向 调转 ,弯曲 角度 均 为 45"。 任 务 是 要 将 这 些 积木 块 连 在 一 起 组 成 铁路 ,要 求 不 能 

有 重 释 的 轨道 ,不 能 有 松动 ,否则 火车 会 开 出 。 


E> “2 x2 pS x2 


图 3-27 木 制 铁路 积木 集合 的 轨道 块 








(1) 假设 积木 块 是 精确 无 松动 的 。 对 此 问题 给 出 详细 精确 的 形式 化 。 

(2) 选择 一 种 无 信息 搜索 方法 完成 这 个 任务 并 解释 你 选择 的 理由 。 

(3) 解释 为 什么 拿 走 任何 一 个 分 又 块 会 导致 问题 无 解 。 

(4) 对 你 形式 化 的 状态 空间 给 出 上 界 (提示 : 考虑 构造 过 程 中 的 最 大 分 支 因 子 和 最 
大 深度 ,忽略 重 倒 和 松动 。 从 每 类 只 有 一 块 开 始 )。 

考虑 图 3-28 给 出 的 无 边界 的 2D 方 格 图 游戏 。 开 始 状态 为 (0,0), 目 标 状态 为 

(Crz,y)。 边 缘 ( 白 色 结 点 ) 总 是 隔 开 了 状态 空间 的 已 被 探索 区 域 (黑色 结 点 ) 和 未 被 

探索 区 域 ( 灰 色 结 点 ) 。 在 图 3-28(a) 中 ,生成 了 根 结 点 。 在 图 3-28(b) 中 扩展 了 一 

个 叶 结 点 。 在 图 3-28(c) 中 , 根 结 点 的 后 继 以 顺 时 针 顺 序 被 探索 。 

(1) 状态 空间 的 分 支 因子 是 多 少 ? 

(2) 深度 &CA 二 0) 有 多 少 个 状态 ? 

(3) 宽度 优先 树 搜索 扩展 的 最 大 结 点 数 是 多 少 ? 

(4) 宽度 优先 图 搜索 扩展 的 最 大 结 点 数 是 多 少 ? 
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(5) 二 lu 一 zx| 十 lv 一 y| 对 状态 (u,v) 是 可 纳 的 启发 式 吗 ? 请 解释 。 
(6) 使 用 有 的 A 图 搜索 扩展 的 结 点 数 。 

(7) 如 果 删 除 一 些 连 线 必 还 会 是 可 采纳 的 吗 ? 

(8) 如 果 在 一 些 非 邻 近 状 态 间 增 加 一 些 连 线 ,h 还 会 是 可 采纳 的 吗 ? 


(a) (b) (©) 
3-28 ”用 和 矩形 网 格 问题 看 GRAPH-SEARCH 算法 的 分 离 特点 


nn 辆 车 放置 在 n Xn 网 格 的 方 格 (1,1) 至 方 格 (n, 1) 中 。 这 些 车 要 以 相反 序 移 至 另 
一 端 ; 从 (i, 1) 开 始 的 第 i 辆 车 ,目标 位 秆 是 (n 一 i 十 1, 2) 。 每 一 轮 ,每 辆 车 可 以 选 
择 上 、 下 \ 左 \ 右 各 移动 一 格 或 静止 不 动 ; 如 果 某 辆 车 选择 静止 不 动 , 与 它 邻 近 的 车 
(最 多 只 能 有 一 辆 ) 可 以 跳 过 它 。 两 辆 车 不 能 在 同一 格 中 。 
(1) 计算 状态 空间 的 大 小 , 记 为 n 的 函数 。 
(2) 计算 分 支 因 子 的 大 小 , 记 为 n 的 函数 。 
(3) 假设 小 车 i 的 坐标 为 (z;,y) ,并 且 网 格 中 没有 其 他 车 辆 , 它 的 目标 为 (x 一 i 十 1,n)， 
请 给 出 可 采纳 的 启发 式 。 
(4) 对 于 整个 问题 而 言 ,下 列 哪个 启发 式 函数 是 可 采纳 的 ? 请 解释 。 
yD 
ii) max(hi 六) 
证 ) minCh se sh,) 
考虑 图 3-29 中 描述 的 两 人 游戏 。 游 戏 规则 : 选手 A 先 走 。 两 个 选手 轮流 走 棋 ,每 
个 人 只 能 把 自己 的 棋子 移动 到 任 一 方向 上 的 相 邻 空位 中 。 如 果 对 方 的 棋子 占据 着 
相 邻 的 位 置 ,你 可 以 跳 过 对 方 的 棋子 到 下 一 个 空位 。( 例 如 ,A 在 位 置 3,B 在 位 置 
2, 那 么 A 可 以 移 回 位 置 1。) 当 一 方 的 棋子 移动 到 对 方 的 端点 时 ,游戏 结束 。 如 果 A 
先 到 位 置 4,A 的 值 为 十 1 ;如果 B 先 到 位 置 1,A 的 值 为 一 1。 





图 3-29 四 横 格 游戏 (four-square game) 的 初始 格局 


(1) 根据 如 下 约定 画 出 完整 博弈 树 。 
Q@ 每 个 状态 用 (sa， ss) 表 示 , 其 中 sa 和 ss 表示 棋子 的 位 置 。 
@ 每 个 终止 状态 用 方 框 画 出 ,用 圆圈 写 出 它 的 博弈 值 。 
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图 把 循环 状态 (在 到 根 结 点 的 路 径 上 已 经 出 现 过 的 状态 ) 画 上 双 层 方 框 。 由 于 
不 清楚 它们 的 值 ,所 以 在 圆圈 里 标记 一 个 “?”。 
(2) 给 出 每 个 结 点 倒 推 的 极 小 极 大 值 (也 标记 在 圆圈 里 ) 。 解 释 怎 样 处 理 “?” 值 和 为 
什么 这 么 处 理 。 
(3) 解释 标准 的 极 小 极 大 算法 为 什么 在 这 棵 博弈 树 中 会 失败 ,简要 说 明 你 将 如 何 修 
正 它 , 在 (2) 的 图 上 夯 出 你 的 答案 。 你 修正 后 的 算法 对 于 所 有 包含 循环 的 游戏 
都 能 给 出 最 优 决策 吗 ? 
思考 : 这 个 4- 方 格 游戏 可 以 推广 到 ? 个 方 格 , 其 中 ” 字 2。 证 明 : 如 果 是 偶数 A， 
则 一 定 能 赢 ; 如 果 是 奇数 , 则 A 一 定 会 输 
(思考 题 ) 编写 程序 ,输入 为 两 个 网 页 的 URL, 找 出 从 一 个 网 页 到 另 一 个 网 页 的 链 
接 路 径 。 用 哪 种 搜索 策略 最 适合 ? 双向 搜索 适用 吗 ? 能 用 搜索 引擎 实现 一 个 前 驱 
函数 吗 ? 
(思考 题 ) 中 国 象棋 (图 3-30) 。 查 阅 资料 ,并 与 中 国 象棋 计算 机 程序 对 弈 , 曾 述 程序 
实现 的 主要 技术 。 
象棋 的 棋盘 由 9 条 横 线 和 10 条 直线 相交 而 成 。 
棋子 在 线 的 相交 点 上 行走 。 棋 子 的 颜色 分 红 
和 黑 , 红 子 先 走 。 中 间 的 一 行 是 “ 楚 河 汉 界 ”， 
双方 各 有 “九宫 格 ”。 象 棋 行 棋 分 为 : 开局 、 中 
局 、 残 棋 。 双 方 各 有 16 只 棋子 。 黑 方 有 帅 、 
车 X2, 马 X2、 炮 X2, 士 X2., 象 X2, 兵 X5; 红 
方 有 将 、 车 X2. 马 X2、 克 X2、 仕 X2、 相 XxX2、 
卒 X5。 
对 局 时 ,由 执 红 棋 的 一 方 先 走 , 双 方 轮流 各 走 
一 着 , 直至 分 出 胜 、 负 、 和 ,对 局 即 终了 。 轮 到 
走 棋 的 一 方 ,将 某 个 棋子 从 一 个 交叉 点 走 到 另 
一 个 交叉 点 ,或 者 吃 掉 对 方 的 棋子 而 占领 其 交 图 3-30 ”中 国 象棋 
叉 点 ,都 算 走 一 着 。 双 方 各 走 一 着 , 称 为 一 个 
回合 。 如 果 有 一 方 的 主帅 被 对 方 吃 了 ,就 算 那 一 方 输 。 
(思考 题 ) 国际 象棋 。 扩 展 阅读 ,阐述 国际 象棋 中 的 关键 技术 。 
(思考 题 ) 围 棋 。 扩 展 阅读 ,阐述 围棋 中 的 关键 技术 。 
【提示 ] 关 键 技 术 要 点 包括 : 蒙特 卡 洛 算法 ; @ 基 于 知识 的 规则 ,为 给 定 模式 提 
供 特 殊 的 行 棋 建 议 ; @@ 使 用 特殊 的 组 合 博弈 技术 分 析 残 局 。 
(思考 题 ) 桥牌 。 扩 展 阅读 ,阐述 桥牌 中 的 关键 技术 。 
【提示 了 关键 技术 要 点 包括 : @ 为 了 处 理 不 完整 信息 ,使 用 蒙特 卡 洛 采 样 方法 对 未 
知 的 对 手持 牌 情况 进行 模拟 和 分 析 ; @ 使 用 分 层次 的 规划 系统 ; @ 使 用 机 器 学 习 
方法 对 棋局 进行 一 般 化 ,形成 通用 规则 ,并 存储 。 

















第 人 章 
高 级 搜索 


我 们 已 经 讲 过 的 搜索 算法 都 是 设计 用 来 系统 化 地 探索 搜索 空间 的 。 它 
们 在 内 存 中 保留 一 条 或 多 条 路 径 并 且 记 录 哪 些 是 已 经 探索 过 的 ,哪些 是 尚未 
探索 过 的 。 当 找到 目标 时 ,到 达 目 标的 路 径 同 时 也 构成 了 这 个 问题 的 一 个 
解 。 然 而 ,在 许多 问题 中 ,问题 的 解 与 到 达 目 标的 路 径 顺序 是 无 关 的 。 例 如 ， 
在 八 皇后 问题 中 ,重要 的 是 最 终 皇 后 的 布局 ,而 不 是 加 入 皇后 的 次 序 。 这 一 
类 问题 包括 了 许多 重要 的 应 用 ,如 集成 电路 设计 ,工厂 场地 布局 .作业 车 间 调 
度 、 自 动 程序 设计 、 电 信和 网 络 优化 ,车辆 寻 径 以 及 文件 夹 管理 等 。 

如 果 到 目标 的 路 径 与 问题 的 解 并 不 相关 ,将 考虑 各 种 根本 不 关心 路 径 的 
算法 。 局 部 搜索 算法 从 单独 的 一 个 当前 状态 (而 不 是 多 条 路 径 ) 出 发 ,通常 只 
移动 到 与 之 相 邻 的 状态 。 典 型 情况 下 ,搜索 的 路 径 是 不 保留 的 。 虽 然 局 部 搜 
索 算 法 不 是 系统 化 的 ,但 是 它们 有 两 个 关键 的 优点 : 中 它们 只 用 很 少 的 内 
存 一 一 通常 需要 的 存储 量 是 一 个 常数 ; 四 它们 通常 能 在 不 适合 系统 化 算法 
的 很 大 或 无 限 的 (连续 的 ) 状 态 空间 中 找到 合理 的 解 。 

除了 找到 目标 外 ,局 部 搜索 算法 对 于 解决 纯粹 的 最 优化 问题 是 很 有 用 
的 ,其 目标 是 根据 一 个 目标 函数 找到 最 佳 状态 。 许 多 最 优化 问题 不 适合 于 
“标准 的 ”搜索 模型 。 例 如 ,自然 界 提供 了 一 个 目标 函数 一 一 繁殖 适应 性 
达尔 文 的 进化 论 可 以 被 视 为 优化 的 尝试 ,但 是 这 个 问题 没有 “目标 测试 "和 
“路 径 耗 费 "。 为 了 更 好 地 理解 局 部 搜索 ,类 比 地 考虑 一 个 地 形 图 。 地 形 图 既 
有 “位 置 ”( 用 状态 定义 ), 又 有 “高 度 ”( 由 启发 式 耗 散 函 数 或 目标 函数 的 值 定 
义 )。 如 果 高 度 对 应 于 耗 散 , 那 么 目标 是 找到 最 低谷 一 一 即 一 个 全 局 最 小 值 ; 
如 果 高 度 对 应 于 目标 函数 ,那么 目标 是 找到 最 高 峰 一 一 即 一 个 全 局 最 大 值 
(当然 ,可 以 通过 插入 一 个 负 号 使 两 者 相互 转换 ) 。 局 部 搜索 算法 就 像 对 地 形 
图 的 探索 ,如 果 存 在 解 ,那么 完备 的 局 部 搜索 算法 总 能 找到 解 ; 最 优 的 局 部 搜 
索 算 法 总 能 找到 全 局 最 小 值 /最 大 值 。 


4.1 有 疏 山 法 搜索 


和 仆 山 法 (hill-climbing) 搜 索 是 一 种 最 基本 的 局 部 搜索 。 它 像 在 地 形 图 上 
进行 登高 一 样 ,一 直 向 值 增 加 的 方向 持续 移动 ,将 会 在 到 达 一 个 “ 峰 顶 ”时 终 
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止 ,并 且 在 相 邻 状态 中 没有 比 它 更 高 的 值 。 爬 山 法 是 深度 优先 搜索 的 改进 算法 。 在 这 种 
方法 中 ,使 用 某 种 贪心 算法 决定 在 搜索 空间 中 向 哪个 方向 搜索 。 由 于 爬山 法 总 是 选择 往 
局 部 最 优 的 方向 搜索 ,所 以 可 能 会 有 “无 解 * 的 风险 ,而 且 找 到 的 解 不 一 定 是 最 优 解 。 但 
是 , 它 比 深度 优先 搜索 的 效率 高 很 多 。 

这 个 算法 不 维护 搜索 树 ,因此 当前 结 点 的 数据 结构 只 需要 记录 当前 状态 和 它 的 目标 
函数 值 。 爬 山 法 不 会 预测 与 当前 状态 不 直接 相 邻 的 那些 状态 的 值 。 这 就 像 健忘 的 人 在 大 
雾 中 试图 登 珠穆朗玛 峰 一 样 。 爬 山 法 的 具体 算法 如 下 。 


Function HILL- CLIMBING (problem) returns a state that is a local maximum 
Inputs: aproblem 
Local variables: current, a node 
neighbor, a node 
Current <— MAKE- NODE (INITIRL- STATE [problem]) 
Loop do 
neighbor < a highest- valued successor of current 
if VALUE [neighbor]<VALUE [current] then return STATE [current] 
current < neighbor 
End Loop 


下 面 利用 八 皇后 问题 举例 说 明 仆 山 法 算法 。 局 部 搜索 算法 通常 使 用 完全 状态 形式 
化 , 即 每 个 状态 都 表示 为 在 棋盘 上 放 八 个 皇后 ,每 列 一 个 。 后 继 函 数 返 回 的 是 移动 一 个 皇 
后 到 和 它 同 一 列 的 另 一 个 方 格 中 的 所 有 可 能 的 状态 (因此 ,每 个 状态 有 8X7=56 个 后 
继 )。 启 发 式 耗费 函数 疡 是 可 以 彼此 攻击 的 皇后 对 的 数量 ,不 管 中 间 是 否 有 障碍 。 该 函数 
的 全 局 最 小 值 是 0, 仅 在 找到 完美 解 时 才能 得 到 这 个 值 。 图 4. 1(a) 显 示 了 一 个 A=17 的 
状态 。 图 中 还 显示 了 它 的 所 有 后 继 的 值 ,最 好 的 后 继 是 二 12。 息 山 法 算法 通常 在 最 佳 
后 继 的 集合 中 随机 选择 一 个 进行 扩展 ,如 果 这 样 的 后 继 多 于 一 个 。 
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(a) (b) 
图 4-1 八 皇 后 问题 的 息 山 搜索 示意 图 





爬山 法 有 时 称 为 贪 禁 局 部 搜索 ,因为 它 只 是 选择 邻居 状态 中 最 好 的 一 个 ,而 事先 不 考 
虑 之 后 下 一 步 。 尽 管 贪 禁 算 法 是 盲目 的 ,但 贪 禁 算法 往往 是 有 效 的 。 爬 山 法 能 很 快 朝 着 
解 的 方向 进展 ,因为 它 通常 很 容易 改变 一 个 坏 的 状态 。 例 如 ,从 图 4-1(a) 中 的 状态 ,只 需 
要 五 步 就 能 到 达 图 4-1(b) 中 的 状态 , 它 的 /一 1, 这 基本 上 很 接近 于 解 了 。 可 是 , 疏 山 法 经 
常会 遇 到 下 面 问题 。 
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(1) 局 部 极 大 值 : 局 部 极 大 值 是 一 个 比 它 的 每 个 邻居 状态 都 高 的 峰 顶 ,但 是 比 全 局 
最 大 值 要 低 。 息 山 法 算法 到 达 局 部 极 大 值 附近 就 会 被 拉 向 峰 顶 ,然后 卡 在 局 部 极 大 值 处 
无 处 可 走 。 更 具体 地 ,图 4-1(b) 中 的 状态 事实 上 是 一 个 局 部 极 大 值 ( 即 耗 散 的 局 部 极 
小 值 ) ;不 管 移动 哪个 皇后 ,得 到 的 情况 都 会 比 原来 差 。 

(2) 山 湖 : 山 峭 造成 的 是 一 系列 的 局 部 极 大 值 , 贪 禁 算 法 处 理 这 种 情况 是 很 难 的 。 

(3) 平 顶 区 : 平 顶 区 是 在 状态 空间 地 形 图 上 评估 函数 值 平坦 的 一 块 区 域 。 它 可 能 是 
一 块 平 的 局 部 极 大 值 ,不 存在 上 山 的 出 路 ,或 者 是 一 个 山 肩 ,从 山 肩 还 有 可 能 取得 进展 。 
疏 山 法 搜索 可 能 无 法 找到 离开 高 原 的 道路 。 

在 各 种 情况 下 , 疏 山 法 算法 都 会 达到 无 法 取得 进展 的 状态 。 从 一 个 随机 生成 的 八 皇 
后 问题 的 状态 开始 ,最 陡 上 升 的 疏 山 法 86% 的 情况 下 会 被 卡 住 ,只 有 14% 的 问题 实例 能 
求解 。 这 个 算法 速度 很 快 ,成 功 找到 最 优 解 的 平均 步 数 是 4 步 , 被 卡 住 的 平均 步 数 是 3 
步 对 于 包含 8 个 状态 的 状态 空间 ,这 已 经 是 不 错 的 结果 了 。 

前 面 描述 的 算法 中 ,如 果 到 达 一 个 平 顶 区 ,最 佳 后 继 的 状态 值 和 当前 状态 值 相 等 时 将 
会 停止 。 如 果 平 顶 区 其 实 是 山 肩 ,继续 前 进 一 一 即 侧 向 移动 通常 是 一 种 好 方法 。 需 要 注 
意 的 是 ,如 果 在 没有 上 山 移动 的 情况 下 总 是 允许 侧 向 移动 ,那么 当 到 达 一 个 平坦 的 局 部 极 
大 值 而 不 是 山 肩 的 时 候 , 算 法 会 陷 人 无 限 循环 。 一 种 常规 的 解决 办 法 是 设置 允许 连续 侧 
向 移动 的 次 数 限制 。 例 如 ,我们 在 八 皇后 问题 中 允许 最 多 连续 侧 向 移动 100 次 。 这 使 问 
题 实例 的 解决 率 从 14% 提 高 到 94%。 成 功 的 代价 是 : 算法 对 于 每 个 成 功 搜索 实例 的 平 
均 步 数 为 大 约 21 步 ,每 个 失败 搜索 实例 的 平均 步 数 为 大 约 64 步 。 

针对 疏 山 法 的 不 足 , 有 许多 变化 的 形式 。 例 如 ,随机 疏 山 法 , 它 在 上 山 移 动 中 随机 地 
选择 下 一 步 ; 选 择 的 概率 随 上 山 移 动 的 陡峭 程度 而 变化 。 这 种 算法 通常 比 最 陡 上 升 算法 
的 收敛 速度 慢 很 多 ,但 是 在 某 些 状态 空间 地 形 图 上 能 找到 更 好 的 解 。 再 如 ,首选 假山 法 ， 
它 在 实现 随机 息 山 法 的 基础 上 ,采用 的 方式 是 随机 地 生成 后 继 结 点 ,直到 生成 一 个 优 于 当 
前 结 点 的 后 继 。 这 个 算法 在 有 很 多 后 继 结 点 的 情况 下 有 很 好 的 效果 。 

到 现在 为 止 ,我 们 描述 的 仆 山 法 算法 还 是 不 完备 的 它们 经 常会 在 目标 存在 的 情 
况 下 因为 被 局 部 极 大 值 卡 住 而 找 不 到 该 目标 。 还 有 一 种 值得 提出 的 方法 一 一 随机 重新 开 
始 的 候 山 法 , 它 通 过 随机 生成 的 初始 状态 进行 一 系列 的 仆 山 法 搜索 ,找到 目标 时 停止 搜 
索 。 这 个 算法 是 完备 的 概率 接近 于 1, 原 因 是 它 最 终 会 生成 一 个 目标 状态 作为 初始 状态 。 
如 果 每 次 仆 山 法 搜索 成 功 的 概率 为 p, 那 么 需要 重新 开始 搜索 的 期 望 次 数 为 1/p。 对 于 
不 允许 侧 向 移动 的 八 皇后 问题 实例 ,p 守 0. 14, 因 此 大 概 需 要 7 次 迭代 (6 次 失败 ,1 次 成 
功 ) 就 能 找到 目标 。 所 需 步 数 的 期 望 值 为 一 次 成 功 迭 代 的 搜索 步 数 加 上 失败 的 搜索 步 数 
与 (1 一 p)/p 的 乘积 ,大 约 是 22 步 。 如 果 人 允许 侧 向 移动 , 则 平均 需要 迭代 约 1/0. 94s*1. 06 
次 ,平均 步 数 为 (1 X21) 十 (0.06/0.94) X64x25 步 。 那 么 ,对 于 八 皇后 问题 ,随机 重新 开 
始 的 候 山 法 实际 上 是 非常 有 效 的 ,甚至 对 于 300 万 个 皇后 ,这 种 方法 用 不 了 一 分 钟 就 可 以 
找到 解 。 

疏 山 法 算法 成 功 与 否 在 很 大 程度 上 取决 于 状态 空间 地 形 图 的 形状 : 如 果 在 图 中 几乎 
没有 局 部 极 大 值 和 高 原 , 随 机 重新 开始 的 爬山 法 将 会 很 快 地 找到 好 的 解 。 另 一 方面 ,许多 
实际 问题 的 地 形 图 存在 着 大 量 的 局 部 极 值 。NP 难题 通常 有 指数 级 数量 的 局 部 极 大 值 。 
尽管 如 此 ,经 过 少数 随机 重新 开始 的 搜索 之 后 还 是 能 找到 一 个 合理 的 、 较 好 的 局 部 极 大 
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值 的 。 


4.2 模拟 退火 搜索 


模拟 退火 算法 (Simulated Annealing,SA) 的 思想 最 早 是 由 Metropolis 等 (1953) 提 出 
的 。1983 年 ,Kirkpatrick 等 将 其 用 于 组 合 优化 。 模 拟 退 火 算法 是 基于 Mente Carlo 迭代 
求解 策略 的 一 种 随机 寻 优 算法 ,其 出 发 点 是 基于 物理 中 固体 物质 的 退火 过 程 与 一 般 组 合 
优化 问题 之 间 的 相似 性 。 物 质 在 加 热 的 时 候 , 粒 子 间 的 布朗 运动 增强 ,到 达 一 定 强度 后 ， 
固体 物质 转化 为 液态 ,这 个 时 候 再 进行 退火 ,粒子 热 运动 减弱 ,并 逐渐 趋 于 有 序 , 最 后 达到 
稳定 。 

模拟 退火 的 解 不 像 局 部 搜索 那样 最 后 的 结果 依赖 初始 点 。 它 引入 了 一 个 接受 概率 
PP。 如 果 新 的 点 目标 函数 更 好 , 则 p= 二 1, 表 示 选 取 新 点 ;否则 ,接受 概率 p 是 当前 点 ,新 点 
的 目标 函数 以 及 另 一 个 控制 参数 “温度 ”T 的 函数 。 也 就 是 说 ,模拟 退火 没有 像 局 部 搜索 
那样 每 次 都 贪 禁地 寻找 比 现在 好 的 点 ,目标 函数 差 一 些 的 点 也 有 可 能 接受 进来 。 随 着 算 
法 的 执行 ,系统 温度 逐渐 降低 ,最 后 终止 于 不 再 有 可 接受 变化 的 低温 。 模 拟 退 火 算法 
是 一 种 通用 的 搜索 ,优化 算法 ,目前 已 在 工程 中 得 到 广泛 应 用 ,如 VLSI( 超 大 规模 集成 电 
路 )、 生 产 调度 ,控制 工程 .机 器 学 习 ,、 神 经 网 络 、 图 像 处 理 等 领域 。 


4.2.1 模拟 退火 搜索 的 基本 思想 


模拟 退火 算法 最 早 是 针对 组 合 优化 提出 的 ,其 目的 在 于 : 为 具有 NP 复杂 性 的 问 
题 提 供 有 效 的 近似 求解 算法 ; 思 克 服 优化 过 程 陷 人 局 部 极 小 ; 加 克服 初 值 依赖 性 。 模 拟 
退火 算法 的 基本 思想 出 于 物理 退火 过 程 ,因此 我 们 首先 简单 介绍 物理 退火 过 程 。 简 单 而 
言 , 物 理 退 火 过 程 由 以 下 3 部 分 组 成 。 

(1) 加 温 过 程 。 其 目的 是 增强 粒子 的 热 运 动 ,使 其 偏离 平衡 位 置 。 当 温度 足够 高 时 ， 
固体 将 熔 解 为 液体 ,从 而 消除 系统 原先 可 能 存在 的 非 均匀 态 ,使 随后 进行 的 冷却 过 程 以 某 
一 平衡 态 为 起 点 。 熔 解 过 程 与 系统 的 焙 增 过 程 相 联系 ,系统 能 量 也 随 温 度 的 升 高 而 增 大 。 

(2) 等 温 过程 。 物 理学 的 知识 告诉 我 们 ,对 于 与 周围 环境 交换 热量 而 温度 不 变 的 封 
闭 系统 ,系统 状态 的 自发 变化 总 是 朝 自由 能 减少 的 方向 进行 。 当 自由 能 达到 最 小 时 ,系统 
达到 平衡 态 。 

(3) 冷却 过 程 。 其 目的 是 使 粒子 的 热 运动 减弱 并 渐 趋 有 序 ,系统 能 量 逐 渐 下 降 , 从 而 
得 到 低能 的 晶体 结构 。 

固体 在 恒定 温度 下 达到 热平衡 的 过 程 可 以 用 Monte Carlo 方法 模拟 ,虽然 该 方法 简 
单 ,但 必须 大 量 采样 ,才能 得 到 比较 精确 的 结果 ,因而 计算 量 很 大 。 鉴 于 物理 系统 倾向 于 
能 量 较 低 的 状态 ,而 热 运动 又 妨碍 它 准确 落 到 最 低 态 的 原因 ,采样 时 着 重 取 有 重要 贡献 的 
状态 则 可 较 快 达到 较 好 的 结果 。 因 此 ,Metropolis 等 在 1953 年 提出 了 重要 性 采样 法 , 即 
以 概率 接受 新 状态 。 具 体 而 言 ,在 温度 1, 由 当前 状态 i 产生 新 状态 ,两 者 的 能 量 分 别 为 E; 
和 Ej, 车 EE; 二 Ei;, 则 接受 新 状态 j 为 当前 状态 ;否则 ,车 概率 p, 二 exp[ 一 (E; 一 E;)/ kit] 大 
于 [0,1] 区 间 内 的 随机 数 , 则 仍旧 接受 新 状态 j 为 当前 状态 , 若 不 成 立 , 则 保留 状态 i 为 当 
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前 状态 ,其 中 为 Boltzmann 常数 。 当 这 种 过 程 多 次 重复 , 即 经 过 大 量 迁 移 后 ,系统 将 趋 
于 能 量 较 低 的 平衡 态 , 各 状态 的 概率 分 布 将 趋 于 某 种 正则 分 布 ,如 Gibbs 正则 分 布 。 同 


时 ,我 们 也 可 以 看 到 这 种 重要 性 采样 过 程 在 高 温 下 可 接受 与 当 
前 状态 能 量 差 较 大 的 新 状态 .而 在 低温 下 基本 只 接受 与 当前 能 
量 差 较 小 的 新 状态 ,这 与 不 同 温度 下 热 运 动 的 影响 完全 一 致 ,而 
且 当 温度 趋 于 零 时 ,就 不 能 接受 比 当前 状态 能 量 高 的 新 状态 。 
这 种 接受 准则 通常 称 为 Metropolis 准则 , 它 的 计算 量 相 对 
Monte Carlo 方法 要 显著 减少 。 

许多 局 部 搜索 ,类 似 于 组 合 优化 , 即 寻 找 最 优 解 ;* ,使 得 
VsEn0,CcG” ) 一 minC(s) ,其 中 Q={51,ss，,…,s,}) 为 所 有 状态 
构成 的 解 空间 ,C (si) 为 状态 s; 对 应 的 目标 函数 值 。 基 于 
Metropolis 接受 准则 的 优化 过 程 ,可 避免 搜索 过 程 陷 入 局 部 极 
小 ,并 最 终 趋 于 问题 的 全 局 最 优 解 ,如 图 4-2 所 示 。 传 统 的 候 山 





图 4-2 Metropolic 接受 
准则 示意 


搜索 方法 显然 做 不 到 这 一 点 ,从 而 也 对 初 值 具有 依赖 性 。 因 此 ,基于 Metropolis 接受 准 
则 的 最 优化 过 程 与 物理 退火 过 程 存 在 一 定 的 相似 性 ,可 以 用 表 4-1 归纳 。 


表 4-1 最 优化 过 程 与 物理 退火 过 程 对 比 











局 部 搜索 物理 退火 局 部 搜索 物理 退火 
解 粒子 状态 Metropolis 抽样 过 程 等 温 过 程 
最 优 解 能 量 最 低 态 控制 参数 的 下 降 冷却 
设 定 初 温 熔 解 过 程 目标 函数 能 量 











4.2.2 模拟 退火 算法 





1983 年 ,Kirkpatrick 等 意识 到 组 合 优化 与 物理 退火 的 相似 性 ,并 受到 Metropolis 准 
则 的 启迪 ,提出 了 模拟 退火 (SA) 算 法 。SA 算法 是 基于 Monte Carlo 迭代 求解 策略 的 一 
种 随机 寻 优 算法 ,其 出 发 点 是 基于 物理 退火 过 程 与 组 合 优化 之 间 的 相似 性 。SA 由 某 一 
较 高 初 温 开 始 , 利 用 具有 概率 突 跳 特 性 的 Metropolis 抽样 策略 在 解 空间 中 进行 随机 搜 
索 , 伴 随 温度 的 不 断 下 降 重复 抽样 过 程 ,最 终 得 到 问题 的 全 局 最 优 解 。 


标准 模拟 退火 算法 的 一 般 步骤 可 描述 如 下 。 


(1) 给 定 初 温 三 三 ,随机 产生 初始 状态 二 5, 令 二 0。 
(2) Repeat: 
(2.1)Repeat: 
(2.1.1) 产 生 新 状态 3)=Generate(s); 


(2.1.2) if min{l,exp[— (C(s;)- C(3)) /tl]random[0.1] SSj7 


(2.1.3) Until 抽样 稳定 准则 满足 ; 
(2.2) 退 温 tw1=update (tx) ,并 令 于 对 17 
(3) Until 算法 终止 准则 满足 。 
(4) 输 出 算法 搜索 结果 。 
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上 述 模拟 退火 算法 可 用 流程 框图 (图 4-3) 直 观 描述 。 


确定 初始 温度 /0， 
随机 给 定 初始 解 ， 令 本 0 


算法 收敛 准则 
满足 否 ? 


Metropolis 抽 样 稳 
定 准则 满足 否 ? 

























输出 搜索 结果 




















Ti=update(tb, 
令 厂 上 tl 














由 当前 状态 5 
产生 新 状态 5 















min{1,exp[-(C(S)-C(S))]} 
=random[0,1] 





























图 4-3 ”模拟 退火 算法 流程 图 


从 算法 结构 可 知 ,新 状态 产生 函数 、 新 状态 接受 函数 、 退 温 函 数 、 抽 样 稳定 准则 和 退火 
结束 准则 (简称 三 函数 两 准则 ) 以 及 初始 温度 是 直接 影响 算法 优化 结果 的 主要 环节 。 模 拟 
退火 算法 的 实验 性 能 具有 质量 高 . 初 值 鲁 棒 性 强 、 通 用 易 实 现 的 优点 。 但 是 ,为 寻 到 最 优 
解 ,算法 通常 要 求 较 高 的 初 温 、 较 慢 的 降温 速率 、 较 低 的 终止 温度 以 及 各 温度 下 足够 多 次 
的 抽样 ,因而 模拟 退火 算法 往往 优化 过 程 较 长 ,这 也 是 SA 算法 最 大 的 缺点 。 

在 确保 一 定 要 求 的 优化 质量 基础 上 ,提高 模拟 退火 算法 的 搜索 效率 (时 间 性 能 ) 是 对 
SA 算法 进行 改进 的 主要 内 容 。 可 行 的 方案 包括 : 设计 合适 的 状态 产生 函数 ,使 其 根据 
搜索 进程 的 需要 表现 出 状态 的 全 空间 分 散 性 或 局 部 区 域 性 ; 四 设计 高 效 的 退火 历程 
图 避免 状态 的 迁 回 搜索 ; @ 采 用 并 行 搜索 结构 ; @ 为 避免 陷 人 局 部 极 小 ,改进 对 温度 的 
控制 方式 ; @ 选 择 合适 的 初始 状态 ; 设计 合适 的 算法 终止 准则 。 

此 外 ,对 模拟 退火 算法 的 改进 ,也 可 通过 增加 某 些 环节 而 实现 。 主 要 的 改进 方式 包 
括 : 增加 升温 或 重 升温 过 程 ; 思 增 加 记忆 功能 ; 四 增加 补充 搜索 过 程 ; @ 对 每 一 当前 
状态 ,采用 多 次 搜索 策略 ,以 概率 接受 区 域内 的 最 优 状 态 ,而 非 标准 SA 的 单 次 比较 方式 ; 
句 结合 其 他 搜索 机 制 的 算法 ,如 遗传 算法 、 混 沌 搜索 等 ; @ 上 述 各 方法 的 综合 应 用 。 

基于 并 行 计算 和 分 布 式 计算 技术 的 发 展 ,并 行 算法 的 设计 已 成 为 算法 研究 的 重要 内 
容 。 目 前 ,并 行 算法 的 设计 主要 采用 如 下 两 种 策略 : 一 种 是 修改 现 有 串 行 算法 的 结构 ; 另 
一 种 是 针对 并 行 计算 机 的 结构 特点 ,直接 设计 并 行程 序 。 通 常 , 并 行 算法 的 设计 需要 考虑 
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到 存储 区 分 配 、 同 步 处 理 数据 集成 与 通信 等 环节 。 

就 模拟 退火 算法 而 言 ,由 于 算法 初始 和 结束 阶段 与 整个 算法 进程 具有 一 定 的 独立 性 ， 
抽样 过 程 与 退火 过 程 也 具有 一 定 的 独立 性 ,因此 ,模拟 退火 算法 比较 容易 实现 其 并 行 化 方 
式 。 可 行 的 方案 包括 操作 并 行 性 、 进 程 并 行 性 、 空 间 并 行 性 。 


4.2.3 模拟 退火 算法 关键 参数 和 操作 的 设计 


从 算法 流程 上 看 ,模拟 退火 算法 包括 三 函数 两 准则 , 即 状态 产生 函数 .状态 接受 函数 、 
温度 更 新 函数 、 内 循环 终止 准则 和 外 循环 终止 准则 ,这 些 环节 的 设计 将 决定 SA 算法 的 优 
化 性 能 。 此 外 , 初 温 的 选择 对 SA 算法 性 能 也 有 很 大 影响 。 

理论 上 ,SA 算法 的 参数 只 有 满足 算法 的 收敛 条 件 , 才 能 保证 实现 的 算法 依 概率 1 收 
敛 到 全 局 最 优 解 。 然 而 ,SA 算法 的 某 些 收 敛 条 件 无 法 严格 实现 ,即使 某 些 收敛 条 件 可 以 
实现 ,但 也 常常 会 因为 实际 应 用 的 效果 不 理想 而 不 被 采用 。 因 此 ,至 今 SA 算法 的 参数 选 
择 依然 是 一 个 难题 ,通常 只 能 依据 一 定 的 启发 式 准则 或 大 量 的 实验 加 以 选取 。 

1. 状态 产生 函数 

设计 状态 产生 函数 ( 邻 域 函数 ) 的 出 发 点 应 该 是 尽 可 能 保证 产生 的 候选 解 遍布 全 部 解 
空间 。 通 常 ,状态 产生 函数 由 两 部 分 组 成 , 即 产 生 候 选 解 的 方式 和 候选 解 产生 的 概率 分 
布 。 前 者 决定 由 当前 解 产 生 候选 解 的 方式 ,后 者 决定 在 当前 解 产 生 的 候选 解 中 选择 不 同 
状态 的 概率 。 候 选 解 的 产生 方式 由 问题 的 性 质 决 定 , 通 常 在 当前 状态 的 邻 域 结 构 内 以 一 
定 概 率 方式 产生 ,而 邻 域 函数 和 概率 方式 可 以 多 样 化 设计 ,其 中 概率 分 布 可 以 是 均匀 分 
布 . 正 态 分 布 、 指 数 分 布 , 柯 西 分 布 等 。 

2. 状态 接受 函数 

状态 接受 函数 一 般 以 概率 的 方式 给 出 ,不同 接受 函数 的 差别 主要 在 于 接受 概率 的 形 
式 不 同 。 设 计 状 态 接受 概率 应 该 遵循 以 下 原则 : 在 固定 温度 下 ,接受 使 目标 函数 值 下 
降 的 候选 解 的 概率 要 大 于 使 目标 函数 值 上 升 的 候选 解 的 概率 ; @ 随 温度 的 下 降 , 接 受 使 
目标 函数 值 上 升 的 解 的 概率 要 逐渐 减 小 ; 回 当 温度 趋 于 零 时 ,只 能 接受 目标 函数 值 下 降 
的 解 。 

状态 接受 函数 的 引入 是 SA 算法 实现 全 局 搜索 的 最 关键 的 因素 ,但 实验 表明 ,状态 接 
受 函 数 的 具体 形式 对 算法 性 能 的 影响 不 显著 。 因 此 ,SA 算法 中 通常 采用 min[1,exp 
(一 AC/1)] 作 为 状态 接受 函数 。 

3. 初 温 

初始 温度 二 温度 更 新 函数 .内 循环 终止 准则 和 外 循环 终止 准则 通常 被 称 为 退火 历程 
(annealing schedule) 。 

实验 表明 , 初 温 越 大 ,获得 高 质量 解 的 概率 越 大 ,但 花费 的 计算 时 间 将 增加 。 因 此 , 初 
温 的 确定 应 折 中 考虑 优化 质量 和 优化 效率 ,常用 的 方法 包括 : 均匀 抽样 一 组 状态 ,以 各 
状态 目标 值 的 方差 为 初 温 。 四 随机 产生 一 组 状态 ,确定 两 两 状态 间 的 最 大 目标 值 差 
| Amax| ,然后 依据 差 值 利 用 一 定 的 函数 确定 初 温 。 例 如 nm 一 一 Amax/lnPr, 其 中 Pr 为 
初始 接受 概率 。 若 取 Pr 接近 1, 且 初始 随机 产生 的 状态 能 够 一 定 程度 上 表征 整个 状态 空 
间 时 ,算法 将 以 几乎 等 同 的 概率 接受 任意 状态 ,完全 不 受 极 小 解 的 限制 。 思 利用 经 验 公 式 
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给 出 。 

4. 温度 更 新 函数 

温度 更 新 函数 , 即 温度 的 下 降 方式 ,用 于 在 外 循环 中 修改 温度 值 。 

在 非 时 齐 SA 算法 收敛 性 理论 中 ,更 新 函数 可 采用 函数 4 二 a/log(k 十 k。)。 由 于 温度 
与 退 温 时 间 的 对 数 函 数 成 反比 ,所 以 温度 下 降 的 速度 很 慢 。 当 a 取 值 较 大 时 ,温度 下 降 到 
比较 小 的 值 需要 很 长 的 计算 时 间 。 快 速 SA 算法 采用 更 新 函数 4 二 B/(1 十 k) ,与 前 式 相 
比 ,温度 下 降 速 度 加 快 了 。 但 需要 强调 的 是 ,单纯 温度 下 降 速 度 加 快 并 不 能 保证 算法 以 较 
快 的 速度 收敛 到 全 局 最 优 , 温 度 下 降 的 速率 必须 与 状态 产生 函数 相 匹 配 。 

在 时 齐 SA 算法 收敛 性 理论 中 ,要 求 温度 最 终 趋 于 零 ,但 对 温度 的 下 降 速度 没有 任何 
限制 ,这 并 不 意味 着 可 以 使 温度 下 降 得 很 快 ,因为 在 收敛 条 件 中 要 求 各 温度 下 产生 的 候选 
解数 目 无 穷 大 ,显然 这 在 实际 应 用 时 是 无 法 实现 的 。 通 常 ,各 温度 下 产生 的 候选 解 越 多 ， 
温度 下 降 的 速度 越 快 。 

目前 ,常用 的 温度 更 新 函数 为 指数 退 温 , 即 41 二。 其 中 ,0 二 4 二 1 且 大 小 可 以 不 
断 变化 。 

5. 内 循环 终止 准则 

内 循环 终止 准则 或 称 Metropolis 抽样 稳定 准则 ,用 于 决定 在 各 温度 下 产生 候选 解 的 
数目 。 在 非 时 齐 SA 算法 理论 中 ,由 于 在 每 个 温度 下 只 产生 一 个 或 少量 候选 解 ,所 以 不 存 
在 选择 内 循环 终止 准则 的 问题 。 而 在 时 齐 SA 算法 理论 中 ,收敛 性 条 件 要 求 在 每 个 温度 
下 产生 候选 解数 目 趋 于 无 穷 大 ,以 使 相应 的 马 氏 链 达 到 平稳 概率 分 布 ,显然 在 实际 应 用 算 
法 时 这 是 无 法 实现 的 。 常 用 的 抽样 稳定 准则 包括 : 中 检 验 目标 函数 的 均值 是 否 稳 定 ， 
加 连续 若干 步 的 目标 值 变化 较 小 ; 图 按 一 定 的 步 数 抽样 。 

6. 外 循环 终止 准则 

外 循环 终止 准则 , 即 算法 终止 准则 ,用 于 决定 算法 何 时 结束 。 设 置 温 度 终 值 1. 是 一 
种 简单 的 方法 。SA 算法 的 收敛 性 理论 中 要 求 1。 趋 于 零 , 这 显然 是 不 实际 的 。 通 常 的 做 
法 包括 : 四 设置 终止 温度 的 阔 值 ; 思 设 置 外 循环 欠 代 次 数 ; 回 算法 搜索 到 的 最 优 值 连续 
若干 步 保 持 不 变 ; @ 检 验 系 统 炉 是 否 稳定 。 

由 于 算法 的 一 些 环节 无 法 在 实际 设计 算法 时 实现 ,因此 SA 算法 往往 得 不 到 全 局 最 
优 解 ,或 算法 结果 存在 波动 性 。 许 多 学 者 试图 给 出 选择 “最 佳 ”SA 算法 参数 的 理论 依据 ， 
但 所 得 结论 与 实际 应 用 还 有 一 定 距 离 ,特别 是 对 连续 变量 函数 的 优化 问题 。 目 前 ,SA 算 
法 参数 的 选择 仍 依赖 于 一 些 启 发 式 准则 和 待 求 问题 的 性 质 。SA 算法 的 通用 性 很 强 , 算 
法 易于 实现 ,但 要 真正 取得 质量 和 可 靠 性 高 , 初 值 鲁 棒 性 好 的 效果 ,克服 计算 时 间 较 长 , 效 
率 较 低 的 缺点 ,并 适用 于 规模 较 大 的 问题 , 尚 需 进 行 大 量 的 研究 工作 。 


4.3 遗传 算法 


遗传 算法 (Genetic Algorithms, GA) 是 随机 剪 枝 搜索 的 一 个 变化 形式 ,20 世纪 60 年 
代 末期 到 70 年 代 初期 ,由 美国 Michigan 大 学 的 John Holland 等 人 研究 形成 了 一 个 较 完 
整 的 理论 和 方法 ,从 试图 解释 自然 系统 中 生物 的 复杂 适应 过 程 入手 ,模拟 生物 进化 的 机 制 
构造 人 工 系统 的 模型 。 
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遗传 算法 以 一 种 群体 中 的 所 有 个 体 为 对 象 , 并 利用 随机 化 技术 指导 对 一 个 被 编码 的 
参数 空间 进行 高 效 搜索 。 其 中 ,选择 .交叉 和 变异 构成 了 遗传 算法 的 遗传 操作 ;参数 编码 、 
初始 群体 的 设 定 、 适 应 度 函数 的 设计 、 遗 传 操作 设计 、 控 制 参数 设 定 5 个 要 素 组 成 了 遗传 
算法 的 核心 内 容 。 作 为 一 种 新 的 全 局 优化 搜索 算法 ,遗传 算法 以 其 简单 通用 、 健 壮 性 强 、 
适 于 并 行 处 理 以 及 高 效 、 实 用 等 显著 特点 ,在 各 个 领域 得 到 广泛 应 用 ,取得 了 良好 效果 ,并 
逐渐 成 为 重要 的 智能 算法 之 一 。 


4.3.1 遗传 算法 的 基本 思想 


遗传 算法 是 从 代表 问题 可 能 潜在 解 集 的 一 个 种 群 (population) 开 始 的 ,而 一 个 种 群 
由 经 过 基因 (gene) 编 码 (coding) 的 一 定数 目的 个 体 (individual) 组 成 。 每 个 个 体 实 际 上 是 
染色 体 (chromosome) 带 有 特征 的 实体 。 染 色 体 作为 遗传 物质 的 主要 载体 , 即 多 个 基因 的 
集合 ,其 内 部 表现 ( 即 基因 型 ) 是 某 种 基因 组 合 , 它 决定 了 个 体形 状 的 外 部 表现 ,如 黑头 发 
的 特征 是 由 染色 体 中 控制 这 一 特征 的 某 种 基因 组 合 决定 的 。 因 此 ,在 一 开始 需要 实现 从 
表现 型 到 基因 型 的 映射 , 即 编码 工作 。 由 于 仿照 基因 编码 的 工作 很 复杂 ,我 们 往往 进行 简 
化 ,如 二 进 制 编码 。 初 代 种 群 产生 之 后 ,按照 适 者 生存 和 优胜 劣 汰 的 规律 , 逐 代 
(generation) 演 化 产生 出 越 来 越 好 的 近似 解 。 在 每 一 代 , 根 据 问题 域 中 个 体 的 适应 度 
(fitness) 大 小 挑选 (selection) 个 体 , 并 借助 自然 遗传 学 的 遗传 算 子 (genetic operators) 进 
行 组 合 交叉 (crossover) 和 变异 (mutation) ,产生 出 代表 新 的 解 集 的 种 群 。 这 个 过 程 将 导 
臻 种 群像 自然 进化 一 样 的 后 代 种 群 比 前 代 更 加 适应 环境 ,末代 种 群 中 的 最 优 个 体 经 过 解 
码 (decoding) ,可 以 作为 问题 近似 最 优 解 。 

遗传 算法 采纳 了 自然 进化 模型 ,如 选择 、 交 叉 、 变 异 、 迁 移 、 局 域 与 邻 域 等 。 图 4-4 表 
示 了 基本 遗传 算法 的 过 程 。 计 算 开 始 时 ,一 定数 目 N 个 个 体 ( 父 个 体 1、 父 个 体 2、 父 个 体 
3、 父 个 体 4.…… ) 即 种 群 随机 地 初始 化 ,并 计算 每 个 个 体 的 适应 度 函 数 ,第 一 代 即 初始 代 
就 产生 了 。 如 果 不 满足 优化 准则 ,开始 产生 新 一 代 的 计算 。 为 了 产生 下 一 代 , 按 照 适 应 度 
选择 个 体 , 父 代 进 行 基因 重组 (交叉 ) 而 产生 子 代 。 所 有 的 子 代 按 一 定 概率 变异 。 然 后 子 
代 的 适应 度 又 被 重新 计算 , 子 代 被 插入 到 种 群 中 将 父 代 取 而 代 之 ,构成 新 的 一 代 ( 子 个 体 
1 子 个 体 2、 子 个 体 3 子 个 体 ew )。 这 一 过 程 循环 执行 ,直到 满足 优化 准则 为 止 。 

尽管 这 样 单一 种 群 的 遗传 算法 很 强大 ,可 以 很 好 地 解决 相当 广泛 的 问题 ,但 采用 多 种 
群 ( 即 有 子 种群 ) 的 算法 往往 会 获得 更 好 的 结果 。 每 个 子 种 群像 单 种 群 遗 传 算法 一 样 独立 
地 演算 若干 代 后 ,在 子 种 群 之 间 进 行 个 体 交 换 。 这 种 多 种 群 遗 传 算法 更 贴近 于 自然 种 族 
的 进化 , 称 为 并 行 遗传 算法 (Paralleling Genetic Algorithm, PGA)。 

随 着 问题 种 类 的 不 同 以 及 问题 规模 的 扩大 ,要 寻求 一 种 能 以 有 限 的 代价 解决 搜索 和 
优化 的 通用 方法 ,遗传 算法 正 是 为 我 们 提供 的 一 个 有 效 的 途径 , 它 不 同 于 传统 的 搜索 和 优 
化 方法 。 主 要 区 别 如 下 : @ 自 组 织 . 自 适应 和 自学 习性 (智能 性 )。 四 遗传 算法 的 本 质 并 
行 性 。 图 遗传 算法 不 需要 求 导 或 其 他 辅助 知识 ,只 需要 影响 搜索 方向 的 目标 函数 和 相应 
的 适应 度 函 数 。@ 遗 传 算法 强调 概率 转换 规则 ,而 不 是 确定 的 转换 规则 。@ 遗 传 算法 可 
以 更 加 直接 地 被 应 用 。@ 遗 传 算法 对 给 定 问题 ,可 以 产生 许多 潜在 解 , 最 终 的 选择 由 使 用 
者 确定 。 
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图 4-4 基本 遗传 算法 的 过 程 





4.3.2 遗传 算法 的 基本 操作 


遗传 算法 包括 3 个 基本 操作 : 选择 .交叉 或 基因 重组 和 变异 。 这 些 基本 操作 又 有 许 
多 不 同 的 方法 ,下 面 逐一 进行 介绍 。 

1. 选择 

选择 是 用 来 确定 重组 或 交叉 个 体 , 以 及 被 选 个 体 将 产生 多 少 个 子 代 个 体 。 首 先 计算 
适应 度 : 四 按 比 例 的 适应 度 计 算 ; @ 基 于 排序 的 适应 度 计算 。 

适应 度 计 算 之 后 是 实际 的 选择 ,按照 适应 度 进 行 父 代 个 体 的 选择 。 可 以 挑选 以 下 算 
法 : 轮 盘 赌 选择 ;随机 遍历 抽样 ;局 部 选择 ;截断 选择 ;锦标 赛 选择 。 

2. 交叉 或 基因 重组 (crossover/recombination) 

基因 重组 是 结合 来 自 父 代 交 配种 群 中 的 信息 产生 新 的 个 体 。 依 据 个 体 编码 表示 方法 
的 不 同 , 有 如 下 算法 : @ 实 值 重 组 、 包 括 离散 重组 .中 间 重 组 、 线 性 重组 .扩展 线性 重组 ; 
四 二 进 制 交叉 ,包括 单 点 交叉 、 多 点 交叉 ,均匀 交叉 、 洗 牌 交叉 缩小 代理 交叉 。 

3. 变异 (mutation) 


交叉 之 后 子 代 经 历 的 变异 ,实际 上 是 子 代 基因 按 小 概率 扰动 产生 的 变化 。 依 据 个 体 
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编码 表示 方法 的 不 同 ,可 以 有 实 值 变异 、 二 进 制 变异 两 种 算法 。 
这 里 我 们 结合 一 个 简单 的 实例 考察 一 下 二 进 制 编码 的 轮 盘 赌 选择 、 单 点 交叉 和 变异 操作 。 
图 4-5 所 示 的 是 一 组 二 进 制 基因 码 构成 的 个 体 组 成 的 初始 种 群 。 个 体 的 适应 度 评价 
值 经 计算 由 括号 内 的 数值 表示 ,适应 度 越 大 ,代表 这 个 个 体 越 好 。 初 始 种 群 及 其 选择 计算 
见 表 4-2。 





0001100000 O101111001 0000000101 1001110100 1010101010 
(8) (5) (2) (10) (7) 


1110010110 1001011011 1100000001 1001110100 0001010011 
(12) (5) (19) (10) (14) 





图 4-5 初始 种 群 的 分 布 
表 4-2 初始 种 群 及 其 选择 计算 
































个 体 染色 体 适应 度 选择 概率 累积 概率 
1 0001100000 8 0.086 957 0.086 957 
2 0101111001 5 0.054 348 0. 141 304 
3 0000000101 2 0.021 739 0.163 043 
4 1001110100 10 0. 108 696 0.271 739 
5 1010101010 7 0.076 087 0.347 826 
6 1110010110 12 0.130 435 0.478 261 
7 1001011011 5 0.054 348 0.532 609 
8 1100000001 19 0.206 522 0.739 130 
9 1001110100 10 0.108 696 0.847 826 
10 0001010011 14 0.152 174 1.000 000 














轮 盘 赌 选择 方法 类 似 于 博彩 游戏 中 的 轮 盘 赌 。 
如 图 4-6 所 示 , 个 体 适应 度 按 比例 转化 为 选中 概 
率 ,将 轮 盘 分 成 10 个 扇 区 ,因为 要 进行 10 次 选择 ， 
所 以 产生 10 个 [0,1] 之 间 的 随机 数 ,相当 于 转动 
10 次 轮 盘 ,获得 10 次 转盘 停止 时 的 指针 位 置 , 指 
针 停止 在 某 一 扇 区 ,该 扇 区 代表 的 个 体 即 被 选中 。 

假设 产生 随机 数 序列 为 0.070 221, 0. 545 929， 
0.784 567, 0. 446 93, 0. 507 893, 0. 291 198， 
0.716 34, 0. 272 901, 0. 371 435, 0. 854 641 ,将 该 
随机 序列 与 计算 获得 的 累积 概率 比较 , 则 序号 依次 
为 1, 8, 9, 6, 7, 5, 8, 4, 6, 10 的 个 体 被 选中 。 





图 4-6 轮 盘 赌 选择 
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显然 ,适应 度 高 的 个 体 被 选中 的 概率 大 ,而且 可 能 被 选中 ;而 适应 度 低 的 个 体 则 很 有 可 能 
被 淘汰 。 在 第 一 次 生存 竞争 考验 中 ,序号 为 2 的 个 体 (0101111001) 和 序号 为 3 的 个 体 
(0000000101) 被 淘汰 ,取而代之 的 是 适应 度 较 高 的 个 体 8 和 6, 这 个 过 程 被 称 为 再 生 
(reproduction) 。 再 生 之 后 重要 的 遗传 操作 是 交叉 ,在 生物 学 上 称 为 杂交 ,可 以 视 为 生物 
进化 之 所 在 。 以 单 点 交叉 (one-point crossover) 为 例 , 任 意 挑选 经 过 选择 操作 后 种 群 中 两 
个 个 体 作 为 交叉 对 象 , 即 两 个 父 个 体 经 过 染色 体 交 换 重 组 产生 两 个 子 个 体 , 如 图 4-7 所 
示 。 随 机 产生 一 个 交叉 点 位 置 , 父 个 体 1 和 父 个 体 2 在 交叉 点 位 置 之 右 的 部 分 基因 码 互 
换 , 形 成 子 个 体 1 和 子 个 体 2。 类 似 地 ,完成 其 他 个 体 的 交叉 操作 。 





父 个 体 1 | 110000 | 0001 110000 | 0011 | 子 个 体 1 
父 个 体 2 | 000101 | 0011 => 000101 | 0001 | 子 个 体 2 


























图 4-7 单 点 交叉 


如 果 只 考虑 交叉 操作 实现 进化 机 制 ,多 数 情况 下 是 不 行 的 ,这 与 生物 界 近亲 繁殖 影响 
进化 历程 类 似 。 因 为 种 群 的 个 体 数 是 有 限 的 ,经 过 若干 代 交 叉 操 作 , 因 为 源 于 一 个 较 好 祖 
先 的 子 个 体 逐 渐 充 斥 整 个 种 群 的 现象 ,问题 会 过 早 收敛 (premature convergence) 。 当 然 ， 
最 后 获得 的 个 体 不 能 代表 问题 的 最 优 解 。 为 避免 过 早 收 全 ,有 必要 在 进化 过 程 中 加 入 具 
有 新 遗传 基因 的 个 体 。 解 决 办 法 之 一 是 效法 自然 界 生物 变 异 。 生 物性 状 的 变异 实际 上 是 
控制 该 性 状 的 基因 码 发 生 了 突变 ,这 对 于 保持 生物 多 样 性 是 非常 重要 的 。 模 仿生 物 变 异 
的 遗传 操作 ,对 于 二 进 制 的 基因 码 组 成 的 个 体 种 群 ,实现 基因 码 的 小 概率 翻转 , 即 达 到 变 
异 的 目的 。 如 图 4-8 所 示 ,对 于 个 体 1001110100 产生 变异 ,以 小 概率 决定 第 4 个 遗传 因 

四 1 0。 
i eR 1001110100 一 > 1000110100 
基于 适应 度 的 选择 和 再 生 、 交 叉 和 变异 操作 。 将 上 
面 的 所 有 种 群 的 遗传 操作 综合 起 来 ,初始 种 群 的 第 国 W8 本 另 
一 代 进 化 过 程 如 图 4-9 所 示 。 初 始 种 群 经 过 选择 操作 适应 度 较 高 的 8 号 和 6 号 个 体 分 别 
复制 出 2 个 ,适应 度 较 低 的 2 号 和 3 号 个 体 遭 到 淘汰 , 接 下 来 按 一 定 概率 选择 了 4 对 父 个 
体 分 别 完成 交叉 操作 ,在 随机 确定 的 “| 位置 实行 单 点 交叉 生成 4 对 子 个 体 。 最 后 按 小 概 
率 选中 某 个 个 体 的 基因 码 位 置 ,产生 变异 。 这 样 ,经 过 上 述 过 程 便 形 成 了 第 一 代 群 体 。 以 
后 一 代 一 代 的 进化 过 程 如 此 循环 下 去 ,每 一 代 结 束 都 产生 新 的 种 群 。 演 化 的 代数 主要 取 
决 于 代表 问题 解 的 收敛 状态 ,末代 种 群 中 的 最 佳 个 体 作 为 问题 的 最 优 近似 解 。 

遗传 算法 进化 模式 示意 图 如 图 4-10 所 示 ,搜索 空间 中 个 体 演变 为 最 优 个 体 , 其 在 高 
适应 度 上 的 增殖 概率 是 按 世 代 递 增 的 ,图 中 表现 个 体 的 色彩 浓淡 表示 个 体 增 殖 的 概率 
分 布 。 

遗传 算法 的 一 般 流程 如 图 4-11 所 示 。 

第 1 步 : 随机 产生 初始 种 群 , 个 体 数目 一 定 , 每 个 个 体 表示 为 染色 体 的 基因 编码 。 

第 2 步 : 计算 个 体 的 适应 度 ,并 判断 是 否 符合 优化 准则 , 若 符合 , 则 输出 最 佳 个 体 及 
其 代表 的 最 优 解 ,并 结束 计算 ;否则 转向 第 3 步 。 

第 3 步 : 依据 适应 度 选择 再 生 个 体 ,适应 度 高 的 个 体 被 选中 的 概率 高 ,适应 度 低 的 个 
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图 4-11 遗传 算法 的 一 般 流程 
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体 可 能 被 淘汰 。 

第 4 步 : 按照 一 定 的 交叉 概率 和 交叉 方法 ,生成 新 的 个 体 。 

第 5 步 : 按照 一 定 的 变异 概率 和 变异 方法 ,生成 新 的 个 体 。 

第 6 步 : 由 交叉 和 变异 产生 新 一 代 的 种 群 ,返回 到 第 2 步 。 

遗传 算法 中 的 优化 准则 ,一 般 依据 问题 的 不 同 有 不 同 的 确定 方式 。 例 如 ,可 以 采用 以 
下 准则 之 一 作为 判断 条 件 : 四 种 群 中 个 体 的 最 大 适应 度 超过 预先 设 定 值 ; @ 种 群 中 个 体 
的 平均 适应 度 超过 预先 设 定 值 ; 加 世代 数 超过 预先 设 定 值 。 

遗传 算法 需要 把 握 的 重点 如 下 。 

(1) 编码 和 初始 群体 的 生成 。 遗 传 算法 在 进行 搜索 之 前 先 将 解 空间 的 解数 据 表示 成 
遗传 空间 的 基因 型 串 结构 数据 ,这 些 串 结构 数据 的 不 同 组 合 使 构成 了 不 同 的 点 。 然 后 随 
机 产生 N 个 初始 串 结构 数据 ,每 个 串 结构 数据 称 为 一 个 个 体 ,N 个 个 体 构成 了 一 个 群体 。 
遗传 算法 以 这 N 个 串 结构 数据 作为 初始 点 开始 选 代 。 编 码 方式 依赖 于 问题 怎样 描述 比 
较 好 解决 。 初 始 群 体 也 应 该 选取 适当 ,如 果 选 取得 过 小 , 则 杂交 优势 不 明显 ,算法 性 能 很 
差 ; 如 果 选 取得 太 大 , 则 计算 量 太 大 。 

(2) 检查 是 否 满足 算法 收敛 准则 ,控制 算法 是 否 结束 。 可 以 采用 判断 与 最 优 解 的 适 
配 度 或 者 定 一 个 迭代 次 数 达到 。 

(3) 适应 性 值 评估 检测 和 选择 。 适 应 性 函数 表明 个 体 或 解 的 优 劣 性 ,在 程序 的 开始 
也 应 该 评价 适应 性 ,以 便 与 以 后 的 适应 性 作 比 较 。 不 同 的 问题 ,适应 性 函数 的 定义 方式 也 
不 同 。 根 据 适 应 性 的 好 坏 进行 选择 。 选 择 的 目的 是 为 了 从 当前 群体 中 选 出 优良 的 个 体 ， 
使 它们 有 机 会 作为 父 代 为 下 一 代 繁 殖 子孙 。 遗 传 算法 通过 选择 过 程 体 现 这 一 思想 ,进行 
选择 的 原则 是 适应 性 强 的 个 体 为 下 一 代 贡 献 一 个 或 多 个 后 代 的 概率 大 。 选 择 实现 了 达尔 
文 的 适 者 生存 原则 。 

(4) 交叉 (也 称 杂 交 )。 按 照 交 叉 概 率 进行 杂交 。 交 叉 操 作 是 遗传 算法 中 最 主要 的 遗 
传 操作 。 通 过 交叉 操作 可 以 得 到 新 一 代 个体 , 新 个 体 组 合 了 其 父辈 个 体 的 特性 。 交 叉 体 
现 了 信息 交换 的 思想 。 可 以 选 定 一 个 点 对 染色 体 串 进行 互 换 、 择 入 、 道 序 等 交叉 ,也 可 以 
随机 选取 几 个 点 交叉 。 交 叉 概 率 如 果 太 大 ,种 群 更 新 快 ,但 是 高 适应 性 的 个 体 很 容易 被 活 
没 ,概率 小 了 ,搜索 会 停滞 。 

(5) 变异 。 按 照 变异 概率 进行 变异 。 变 异 首先 在 群体 中 随机 选择 一 个 个 体 ,对 于 选 
中 的 个 体 ,以 一 定 的 概率 随机 地 改变 串 结构 数据 中 某 个 串 的 值 。 同 生物 界 一 样 ,GA 中 变 
异 发 生 的 概率 很 低 。 变 异 为 新 个 体 的 产生 提供 了 机 会 。 

变异 可 以 防止 有 效 基因 的 缺损 造成 的 进化 停滞 。 比 较 低 的 变异 概率 已 经 可 以 让 基因 
不 断 变更 , 太 大 了 会 陷入 随机 搜索 。 设 想 一 下 ,生物 界 每 一 代 都 和 上 一 代 差 路 很 大 ,会 是 
怎样 的 可 怕 情 形 ? 

遗传 算法 提供 了 一 种 求解 复杂 系统 优化 问题 的 通用 框架 , 它 不 依赖 问题 的 具体 领域 ， 
对 问题 的 种 类 有 很 强 的 鲁 棒 性 ,所 以 广泛 应 用 于 很 多 学 科 。 遗 传 算法 的 主要 应 用 领域 包 
括 : 函数 优化 ` 组 合 优化 ` 生 产 调度 问题 .自动 控制 机 器 人 智能 控制 图像 处 理 和 模式 识 
别人 工 生命 .遗传 程序 设计 、 机 器 学 习 。 
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4.4 案例 分 析 


旅行 商 问题 描述 如 下 : 有 一 个 旅行 商 ,需要 到 个 城市 去 售 货 ,每 个 城市 只 去 一 次 ， 
且 知 道 任意 两 个 城市 之 间 的 距离 。 计 算 一 条 从 旅行 商 的 驻地 出 发 ,经 过 每 个 城市 ,最 后 返 
回 驻 地 的 最 短 旅行 路 径 。 

下 面 分 别 采用 息 山 算法 、 模 拟 退 火 算法 和 遗传 算法 求解 旅行 商 问题 。 


4.4.1 疏 山 算法 求解 旅行 商 问题 


设计 一 个 解决 旅行 商 问题 的 疏 山 算法 。 

解 : 假定 有 A 个 城市 ,候选 解 的 形式 为 这 & 个 城市 构成 的 向 量 ( 其 中 不 含 重复 的 元 
素 ), 记 为 * 王 二 cayca,cs，…cx 二 。 距 离 矩 阵 Dist 记录 城市 之 间 的 距离 。 

定义 搜索 结 点 为 Node, 包 含 两 个 属性 : 属性 sol 记录 该 结 点 对 应 的 候选 解 ,属性 
value 记录 该 候选 解 对 应 的 距离 代价 ,假定 每 个 候选 解 的 第 1 个 城市 都 为 旅行 商 的 驻地 
城市 。 

定义 一 个 评估 函数 evaluate() ,其 输入 为 一 个 Node 型 参数 ,计算 的 value 值 。 

定义 一 个 邻居 结 点 生成 函数 neighbor_builder() ,其 输入 为 一 个 Node 型 参数 ,返回 
n 的 所 有 邻居 结 点 。 





旅行 商 问 题 息 山 算法 

Cur_ node, best neighbor: Node 

1) 随机 生成 cur_node 的 sol 并 evaluate (cur_node) 
2) repeat 

3) neighbors < neighbor builder (cur node) 

4) best neighbor < cur node 

5) for each n in neighbors do 


6) evaluate (n) 

7) if n.value < best neighbor.value 
8) best_neighbor< mn 

9) if best_neighbor =cur node 

10) return cur node 


11) else cur node < best neighbor 


function evaluate () 

Input: n: Node 

Output:n 对 应 的 路 径 代价 

int distance < 0; 

1) for i=2tokdo 

2) distance < distance +Dist (n.sol[i-1], n.sol[i]) 
3) distance < distance +Dist (n.sol[k], n.s01[1]) 

4) return distance; 
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2) 
3) 
4) 
5) 





function neighbor builder 

Input: n: Node 

Output: a set of Node that is the neighbor of n. 
neighbors ={} 

neighbor: Node 

1) for i =2 tok-1do 


for j=3tokdo 
neighbor < n 
交换 neighbor.sol 中 的 第 i 个 城市 和 第 j 个 城市 的 位 置 
neighbors < neighbors U { neighbor } 


6) return neighbors 





说 明 ,neighbor_builder() 函 数 负责 生成 一 个 结 点 的 所 有 邻居 结 点 ,这 个 函数 应 该 满 
足 一 个 关键 的 性 质 : 任 一 个 结 点 ,通过 连续 应 用 这 个 函数 ,可 以 访问 到 问题 空间 中 的 所 
有 结 点 。 在 此 处 的 参考 解答 中 ,我 们 设计 的 neighbor_builder() 函 数 是 交换 两 个 城市 的 位 


置 ,从 而 得 到 一 个 新 的 问题 空间 结 点 。 


【思考 了 读者 可 以 分 析 这 样 的 设计 是 否 满足 上 述 提 及 的 性 质 ,同时 请 读者 自己 尝试 设 


计 新 型 的 neighbor_builder() 函 数 。 


4.4.2 模拟 退火 算法 求解 旅行 商 问题 


设计 一 个 解决 旅行 商 问题 的 模拟 退火 算法 。 


解 : 





3) 
4) 
5) 
6) 
7) 
8) 
9) 


2) 





旅行 商 问题 模拟 退火 算法 

cur_node, best_neighbor: Node; 

1) 随机 生成 cur_node 的 sol 并 evaluate (cur_node) 
2) forzt =1lto co do 


T=update (t) 

if T =0 then return cur node 

successors < neighbor builder() 

从 successors 中 随机 选择 一 个 结 点 , 记 为 next_node 
AE< next node.value -cur node.value 

if AE < 0 then cur node < next node 

else 以 概率 = “7 执行 cur_node < next_node 


function evaluate () 
Input: n: Node 

Output:n 对 应 的 路 径 代价 
int distance < 0; 

1) for i=2tokdo 


distance < distance +Dist (n.sol[i- 1], n.sol[i]) 
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3) distance < distance +Dist (n.sol1[k], n.s01[1]) 
4) return distance; 


function neighbor builder 
Input: n: Node 

Output: a set of Node that is the neighbor of n. 
neighbors ={} 

neighbor: Node 

1) for i=2 tok-1do 


2) for j=3tokdo 

3) neighbor < mn 

4) 交换 neighbor.sol 中 的 第 i 个 城市 和 第 j 个 城市 的 位 置 
5) neighbors ( neighbors U { neighbor } 


6) return neighbors 


function update () 
Input: t, an integer that represents time 
Output: T, an integer that represents temperature 
if t =0 then 
T< to 
elseT< 入 








【思考 了 请 设计 update() 函数 的 其 他 版 本 ,特别 是 设计 温度 值 T 随时 间 变 量 : 变化 的 


版 本 。 


4.4.3 遗传 算法 求解 旅行 商 问 题 


设计 一 个 解决 旅行 商 问题 的 遗传 算法 。 
解 : 








旅行 商 问题 的 遗传 算法 

# 设 待 解决 的 rsP 问题 有 k 个 城市 

1) population <— { } 

# 生成 含有 10 个 不 相同 个 体 的 初始 种 群 
2) i<—0 


3) do 


4) 随机 生成 一 个 长 度 为 k 的 字符 串 , 字 符 取 自 {0, …，k-1} 且 不 重复 , 记 此 字符 捉 


为 individual 


5) if population 不 含有 individual then 
6) population < population U { individual } 
7) < 主 +1 


8) while (i > =9) 


9) num iteration =0; 
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———— 








10) repeat 

11) new population 一 {} 

12) for i =1 to SIZE (population) do 

13) parentl < random select (population, evaluate()) 
14) parent2 < random select (population, evaluate()) 
15) child < reproduce (parent1, parent2) 

16) 在 [0, 1] 内 生成 一 个 随机 数 = 

17) if r < B then 

18) mutate (child) 

19) new_ population < new population U { child} 
20) population < new_ population 


21) num iterationt+ 


22) until num iteration 之 100000 


function random select 
Input: 
population, 种 群集 
evaluate, 评估 个 体 的 适应 度 函 数 , 见 4.3.1 节 的 解答 
Output: individual, 被 选择 的 个 体 
sun< 0 
for i =1 to SIZE (population) do 
evaluate (population[i]) 
sum <— sum +population[i] .value 
for i =1 to SIZE (population) do 
生成 一 个 [0,1] 内 的 随机 数 = 
if (< (population[i] .value / sum)) then 
individual < Population[i] 
return individual 


function reproduce 

Input: x, y, 两 个 个 体 

Output: x 和 y 交 叉 得 到 的 下 一 代 个 体 = 

n < LENGTH (x); c < random number from 1 ton 

return APPEND (SUBSTRING (x, 1,c) ,SUBSTRING (y, c+1, n)) 








说 明 : SIZE 函数 返回 一 个 集合 的 基数 ;LENGTH 函数 返回 字符 串 的 长 度 ; APPEND 


函数 将 两 个 字符 串 按照 顺序 合并 ;SUBSTRING(z，start，end) 函数 返回 字符 串 x 从 位 
置 start 到 位 置 end 的 字符 串 。 


习题 


a1 
4.2 


对 4.4 节 4.4.1,4.4.2,4.4.3 题 的 算法 和 结果 进行 比较 分 析 。 
(1) 图 4-1(a) 中 第 7 列 皇 后 下 移 到 /一 12 的 位 置 ,重新 计算 ; (2) 对 图 4-1(a) 移 动 
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2 步 ( 按 记 最 小 值 移动 ) ,并 给 出 后 续 值 。 

(思考 题 ) 如 何在 搜索 过 程 中 避免 重 蹈 覆 竹 。 本 章 介绍 的 搜索 算法 的 主要 特点 是 不 
记录 已 访问 的 结 点 ,相对 于 第 3 章 中 那些 记录 已 访问 结 点 的 算法 ,本 章 算法 降低 了 
对 存储 空间 的 要 求 。 然 而 ,不 记录 已 访问 结 点 所 引发 的 副作用 不 容 忽视 ,其 中 的 一 
个 副作用 就 是 搜索 过 程 可 能 会 在 访问 一 个 结 点 之 后 的 不 久 又 再 次 访问 该 结 点 ,这 种 
现象 被 称 为 “循环 搜索 ”"。 禁 忌 搜索 策略 (tabu search strategy) 是 一 种 用 于 减少 “ 循 
环 搜索 ”的 策略 ,该 策略 可 用 于 求解 大 规模 的 优化 问题 ,如 车 间 调 度 、 图 论 中 的 最 大 
团 搜索 问题 。 请 曾 述 禁忌 搜索 策略 的 主要 技术 与 应 用 。 

(思考 题 ) 如 何 改进 爬山 算法 ? 息 山 算法 在 求解 开始 时 所 生成 的 结 点 如 果 处 于 问题 
空间 中 的 一 个 局 部 最 优 区 域 , 则 该 算法 仅 能 找到 一 个 次 优 解 ,而 不 能 找到 全 局 最 优 
解 。 例 如 ,在 图 4-12 中 , 息 山 算法 的 初始 结 点 如 果 是 a 指向 的 结 点 , 则 它 仅 能 得 到 
次 优 解 。 同 理 , 它 分 别 以 b,c 为 初始 结 点 也 仅 能 得 到 次 优 解 。 但 是 ,如 果 扑 山 算法 
从 以 指向 的 结 点 开始 , 它 就 能 找到 全 局 最 优 解 。 怎 样 改 进 爬 山 算 法 ,以 使 它 能 找到 
全 局 最 优 解 呢 ?模拟 退火 算法 是 对 候 山 算法 的 一 种 改进 ,但 是 模拟 退火 算法 存在 耗 
时 较 长 的 可 能 。 设 想 ,如 果 从 a 指向 的 结 点 开始 搜索 ,模拟 退火 算法 或 许 需 要 经 过 
很 长 的 时 间 才 能 进入 d 指向 的 区 域 。 针 对 模拟 退火 算法 耗 时 较 长 的 问题 ,研究 者 
提出 了 一 种 称 为 “随机 重启 搜索 ”(random restart) 的 策略 ,主要 思想 是 在 息 山 算法 
得 到 一 个 解 后 ,重新 启动 它 ,新 的 搜索 过 程 从 一 个 随机 初始 的 结 点 开始 。 随 机 重启 
的 次 数 依据 待 求解 的 问题 和 试验 经 验 而 定 。 请 阐述 * 随 机 重启 搜索 ?策略 的 理论 与 
实验 依据 。 


启发 值 大 








启发 值 小 


图 4-12 ”看 山 算法 


第 号 章 
不 确定 知识 表示 和 推理 


现 有 的 知识 表示 和 推理 技术 往往 把 研究 和 处 理 对 象限 定 在 特定 的 专 
业 知 识 领域 ;对 不 具有 规范 表示 的 知识 领域 , 现 有 技术 的 适用 性 就 大 为 降 
低 。 近 年 来 ,由 于 实际 应 用 的 推动 ,知识 处 理 研 究 发 生 了 许多 重大 变化 ,已 
经 从 注重 研究 知识 的 形式 转向 研究 知识 的 内 容 , 从 注重 研究 良 构 知 识 
(well-structured knowledge) 转向 研究 病 构 知识 (il-structured knowledge) ， 
从 注重 研究 封闭 性 知识 转向 研究 开放 性 知识 ,从 研究 内 涵 完 整 、 协 调和 精 
确 的 知识 转向 研究 内 涵 不 完整 、 不 协调 和 不 精确 的 知识 ,这 些 趋势 可 以 用 
“ 非 规范 知识 处 理 ” 的 概念 概括 。 所 谓 知识 的 非 规 范 性 ,是 指 知识 内 涵 的 难 
处 理性 ,包括 知识 的 不 确定 性 (模糊 知识 、 不 确定 、 随 机 和 不 精确 知识 ) ,或 
知识 的 不 完整 性 (内 容 不 完整 的 知识 和 结构 不 完整 的 知识 ) ,或 知识 的 不 协 
调 性 ( 含 矛 盾 的 知识 、 带 噪声 的 知识 和 含 宛 余 的 知识 ) ,或 知识 非 恒 常 性 (时 
变 知 识 和 启发 式 知识 ) 。 

本 章 讨 论处 理 数据 的 不 精确 (inexactness) 和 知识 的 不 确定 
Cuncertainty) 所 需要 的 一 些 工 具 和 方法 ,主要 包括 在 经 验 基础 上 抽象 得 到 的 
确定 性 因子 方法 .基于 Bayes 理论 的 概率 推理 .基于 信任 测度 函数 的 证 据 理 
论 .基于 模糊 集合 论 的 模糊 推理 等 技术 。 


5.1 概述 


诸如 “ 鸟 是 会 飞 的 "及 “ 常 在 河 边 走 , 哪 能 不 湿 鞋 ”这样 的 常识 (common 
sense) 和 常识 推理 (common sense reasoning) ,我 们 如 何 形式 化 ? 

这 里 说 的 常识 ,常识 推理 与 通常 的 逻辑 推理 不 同 。 首 先 ,常识 具有 不 确 
定性 。 一 个 常识 可 能 有 众多 的 例外 。 一 个 常识 可 能 是 一 种 尚 无 理论 依据 或 
者 缺乏 充分 验证 的 经 验 。 其 次 ,常识 往往 对 环境 有 极 强 的 依存 性 。 由 于 常识 
的 这 种 不 确定 性 ,决定 了 常识 推理 的 所 谓 非 单调 性 , 即 依据 常识 进行 通常 的 
轩 辑 推理 ,但 保留 对 常识 的 不 确定 性 及 环境 的 变迁 造成 的 推理 失误 的 修正 
权 。 非 单调 推理 技术 试图 解决 不 确定 性 推理 问题 。 

既然 人 的 信念 常常 是 不 确定 的 ,就 存在 关于 信念 强度 的 问题 , 即 确定 性 
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程度 到 底 为 多 少 。 最 常见 的 方法 是 把 指示 确定 性 程度 的 数据 附加 到 推理 规则 ,并 由 此 研 
究 不 确定 强度 的 表示 和 计算 问题 。 

陆 汝 铃 院士 曾 主持 一 项 国家 自然 科学 基金 重大 项 目 * 非 规范 知识 处 理 的 基本 理论 和 
核心 技术 ”。 所 谓 知 识 的 非 规范 性 ,是 指 知识 内 涵 的 难处 理性 , 它 包 括 知识 的 不 确定 性 、 知 
识 的 不 完整 性 .知识 的 不 协调 性 和 知识 的 非 恒 常 性 。 该 项 目的 主要 研究 目标 和 研究 内 容 
是 ,从 理论 ,技术 和 示范 应 用 3 个 层面 对 非 规范 知识 处 理 进行 深入 研究 。 在 理论 上 ,要 研 
究 非 规范 知识 的 数学 理论 、 人 逻辑 理论 和 认 知 理论 ;在 技术 上 ,要 研究 非 规 范 知识 的 表示 和 
建 模 、 非 规范 知识 的 获取 和 融合 ,以 及 非 规范 知识 的 通信 和 传播 ;在 示范 应 用 上 ,要 研究 几 
个 特定 领域 的 非 规 范 知 识 , 开 发 海量 非 规范 知识 库 、 示 范 性 语义 网 上 知识 获取 和 知识 编辑 
器 ,以 及 通用 网 上 的 知识 获取 和 知识 编辑 器 。 


5.1.1 什么 是 不 确定 推理 


不 确定 性 是 智能 问题 的 本 质 特征 ,无 论 是 人 类 智能 ,还 是 人 工 智 能 ,都 离 不 开 不 确定 
性 的 处 理 。 可 以 说 ,智能 主要 反映 在 求解 不 确定 性 问题 的 能 力 上 。 

推理 是 人 类 的 思维 过 程 , 它 是 从 已 知事 实 出 发 ,通过 运用 相关 的 知识 逐步 推出 某 个 结 
论 的 过 程 。 其 中 ,已 知事 实 和 知识 是 构成 推理 的 两 个 基本 要 素 。 已 知事 实 又 称 为 证 据 , 用 
以 指出 推理 的 出 发 点 及 推理 时 应 使 用 的 知识 ;而 知识 是 推理 得 以 向 前 推进 ,并 逐步 达到 最 
终 目 标的 依据 。 第 2 章 介 绍 的 演绎 推理 是 一 种 精确 的 推理 ,因为 它 处 理 的 是 精确 事实 和 
知识 ,并 运用 确定 的 推理 方法 得 出 精确 的 结论 。 

在 客观 世界 中 ,由 于 事物 发 展 的 随机 性 和 复杂 性 ,人 类 认识 的 不 完全 、 不 可 靠 ,不 精确 
和 不 一 致 性 ,自然 语言 中 存在 的 模糊 性 和 歧义 性 ,使 得 现实 世界 中 的 事物 以 及 事物 之 间 的 
关系 极其 复杂 , 带 来 了 大 量 的 不 确定 性 。 如 果 采 用 确定 性 的 经 典 多 辑 处 理 不 确定 性 ,就 需 
要 把 知识 或 思维 行为 中 原本 具有 的 不 确定 性 划 归 为 确定 性 处 理 ,这 无 疑 会 舍 去 事物 的 某 
些 重要 属性 ,造成 信息 流失 ,妨碍 人 们 做 出 最 好 的 决定 ,甚至 可 能 做 出 错误 的 决定 。 大 多 
数 要 求 智能 行为 的 任务 都 具有 某 种 程度 的 不 确定 。 不 确定 性 可 以 理解 为 在 缺少 足够 信息 
的 情况 下 做 出 判断 。 

确定 性 推理 是 建立 在 经 典 逻辑 基础 上 的 ,经 典 迎 辑 的 基础 之 一 就 是 集合 论 ,集合 论 中 
的 隶属 概念 是 一 个 非常 精确 和 确定 的 概念 ,一 个 元 素 是 否 属 于 某 个 集合 是 非常 明确 的 。 
这 在 很 多 实际 情况 中 是 很 难 做 到 的 ,如 高 、 矮 、. 胖 、 瘦 就 很 难 精确 地 区 分 。 因 此 ,经 典 迎 辑 
不 适合 用 来 处 理 不 确定 性 。 针 对 不 同 的 不 确定 性 起 因 , 人 们 提出 了 不 同 的 理论 和 方法 ,以 
建立 适合 描述 不 确定 和 不 精确 的 新 的 逮 辑 模型 。 因 此 ,可 以 说 不 确定 推理 是 建立 在 非 经 
典 迎 辑 基础 上 的 一 种 推理 , 它 是 对 不 确定 性 知识 的 运用 与 处 理 。 严 格 地 说 ,不 确定 性 推理 
就 是 从 不 确定 性 初始 证 据 出 发 ,通过 运用 不 确定 性 的 知识 ,最 终 推出 具有 一 定 程度 的 不 确 
定性 ,但 却 是 合理 或 者 近乎 合理 的 结论 的 思维 过 程 。 


5.1.2 不 确定 推理 要 解决 的 基本 问题 


证 据 和 规则 的 不 确定 性 ,导致 所 产生 的 结论 的 不 确定 性 。 不 确定 性 推理 反映 了 知识 
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不 确定 性 的 动态 积累 和 传播 过 程 ,推理 的 每 一 步 都 需要 综合 证 据 和 规则 的 不 确定 因素 , 通 
过 某 种 不 确定 性 测度 ,寻找 尽 可 能 符合 客观 实际 的 计算 模式 ,通过 不 确定 测度 的 传递 计 
算 , 最 终 得 到 结果 的 不 确定 测度 。 
因此 ,在 基于 规则 的 专家 系统 中 ,不 确定 性 表现 在 证 据 、 规 则 和 推理 3 个 方面 ,需要 对 
专家 系统 中 的 事实 与 规则 给 出 不 确定 性 描述 ,并 在 此 基础 上 建立 不 确定 性 的 传递 计算 方 
法 。 因 此 ,要 实现 对 不 确定 性 知识 的 处 理 , 必 须 解决 不 确定 知识 的 表示 问题 ,不 确定 信息 
的 计算 问题 ,以 及 不 确定 性 表示 和 计算 的 语义 解释 问题 。 

1. 表示 问题 

表示 问题 指 的 是 采用 什么 方法 描述 不 确定 性 。 通 常 有 数值 表示 和 非 数值 的 语义 表示 
两 种 方法 。 数 值 表示 便于 计算 .比较 ; 非 数值 表示 是 一 种 定性 的 描述 。 

专家 系统 中 的 “不 确定 性 ?一般 分 为 两 类 : 一 是 规则 的 不 确定 性 ;二 是 证 据 的 不 确 
定性 。 

(1) 规则 的 不 确定 性 (E 一 及 ,f( 理 ,E)) ,表示 相应 知识 的 不 确定 性 程度 , 称 为 知识 或 
规则 强度 。 

(2) 证 据 的 不 确定 性 (E,C(E)) ,表示 证 据 尼 为 真 的 程度 。 它 有 两 种 来 源 : 初始 证 据 
(由 用 户 给 出 ;前面 推 出 的 结论 作为 当前 证 据 ( 通 过 计算 得 到 ) 。 

一 般 来 说 ,证 据 不 确定 性 的 表示 方法 应 与 知识 不 确定 性 的 表示 方法 保持 一 致 ,证 据 的 
不 确定 性 通常 也 是 一 个 数值 表示 , 它 代表 相应 证 据 的 不 确定 性 程度 , 称 为 动态 强度 。 

2. 计算 问题 

计算 问题 主要 指 不 确定 性 的 传播 与 更 新 , 即 获 得 新 信息 的 过 程 。 它 是 在 领域 专家 给 
出 的 规则 强度 和 用 户 给 出 的 原始 证 据 的 不 确定 性 的 基础 上 ,定义 一 组 函数 , 求 出 结论 的 不 
确定 性 度量 。 它 主要 包括 如 下 3 个 方面 。 

1) 不 确定 性 的 传递 算法 

在 每 一 步 推理 中 ,如 何 把 证 据 及 规则 的 不 确定 性 传递 给 结论 。 在 多 步 推理 中 ,如 何 把 
初始 证 据 的 不 确定 性 传 给 结论 。 

也 就 是 说 ,已 知 规则 的 前 提 下 的 不 确定 性 CCE) 和 规则 强度 /五 ,E) , 求 假设 五 的 不 
确定 性 CCH) , 即 定义 函数 广 ,使 得 : 

CH) = FC AH EY 





2) 结论 不 确定 性 合成 
推理 中 有 时 会 出 现 这 样 一 种 情况 : 用 不 同 的 知识 进行 推理 ,得 到 相同 结论 ,但 不 确定 
性 的 程度 却 不 相同 。 
即 已 知 由 两 个 独立 的 证 据 EE 和 已 : 求 得 的 假设 互 的 不 确定 性 度量 C1(H) 和 CC;(H)， 
求证 据 El 和 Es 的 组 合 导 致 的 假设 互 的 不 确定 性 C( 互 ) , 即 定义 函数 户 ,使 得 : 
CH = fCH(BISCOAHD 
3) 组 合 证 据 的 不 确定 性 算法 
即 已 知 证 据 E 和 Es 的 不 确定 性 度量 C(E,) 和 CCE,) ,求证 据 E 和 已, 的 析 取 和 合 
取 的 不 确定 性 , 即 定义 函数 户 和 户 ,使 得 : 
OB NEY =. fC COBY 
CB VV ED = (CO CE YD 
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目前 关于 组 合 证 据 的 不 确定 性 的 计算 已 经 提出 了 多 种 方法 ,用 得 最 多 的 是 如 下 3 种 。 
(a) 最 大 最 小 法 
CCE，A 已 ) = min(CCE,) ,CCE:)) 
CE V E,) = max(CCE,) ,CCE:)) 
(b) 概率 方法 
CE A E,) = C(E) x C(E,) 
C(E! V 已 ) = C(E)+C(E.)—C(E) XC(E,) 
(c) 有 界 方法 
CE 人 已 ) = max{0,C(E) +C(E,)—1} 
CCE V E:) = min{1,C(E,) + C(E,)} 
3. 语义 问题 
语义 问题 指 上 述 表示 和 计算 的 含义 是 什么 ,如 C( 玉 ,EE) 可 理解 为 当前 提 下 为 真 时 ， 
对 结论 玉 为 真 的 一 种 影响 程度 ,CCE) 可 理解 为 已 为 真 的 程度 。 
目前 ,在 人 工 智能 领域 ,处 理 不 确定 性 问题 的 主要 数学 工具 有 概率 论 和 模糊 数学 。 概 
率 论 与 模糊 数学 研究 和 处 理 的 是 两 种 不 同 的 不 确定 性 。 概 率 论 研究 和 处 理 随机 现象 , 事 
件 本 身 有 明确 的 含义 ,只 是 由 于 条 件 不 充分 ,使 得 在 条 件 和 事件 之 间 不 能 出 现 决定 性 的 因 
果 关 系 ( 随 机 性 ) 。 模 糊 数学 研究 和 处 理 模糊 现象 ,概念 本 身 就 没有 明确 的 外 延 ,一 个 对 象 
是 否 符合 这 个 概念 是 难以 确定 的 (属于 模糊 的 )。 无 论 采 用 什么 数学 工具 和 模型 ,都 需要 
对 规则 和 证 据 的 不 确定 性 给 出 度量 。 
规则 的 不 确定 性 度量 /( 互 ,E) 需 要 定义 在 下 述 3 个 典型 情况 下 的 取 值 。 
(1) 若 下 为 真 , 则 末 为 真 ,这 时 /(H,E) 的 值 。 
(2) 若 为 真 , 则 互 为 假 , 这 时 /( 互 ,E) 的 值 。 
(3) 下 对 互 没有 影响 ,这 时 F( 瑟 ,E) 的 值 。 
对 于 证 据 的 不 确定 性 度量 C(E) ,需要 定义 在 下 述 3 个 典型 情况 下 的 取 值 。 
(1) 羽 为 真 ,CCGE) 的 值 。 
(2) EE 为 假 ,C(E) 的 值 。 
(3) 对 下 一 无 所 知 ,C(CE) 的 值 。 
对 于 一 个 专家 系统 ,一 旦 给 定 了 上 述 不 确定 性 的 表示 、 计 算 及 其 相关 的 解释 ,就 可 以 
从 最 初 的 观察 证 据 出 发 ,得 出 相应 结论 的 不 确定 性 程度 。 专 家 系统 的 不 确定 性 推理 模型 
指 的 就 是 证 据 和 规则 的 不 确定 性 的 测度 方法 以 及 不 确定 性 的 组 合计 算 模 式 。 


5.1.3 不 确定 性 推理 方法 分 类 


关于 不 确定 性 推理 方法 的 研究 ,主要 沿 两 条 不 同 的 路 线 发 展 。 

(1) 在 推理 级 扩展 不 确定 性 推理 的 方法 : 其 特点 是 把 不 确定 证 据 和 不 确定 的 知识 分 
别 与 某 种 量度 标准 对 应 起 来 ,并 且 给 出 更 新 结论 不 确定 性 算法 ,从 而 建立 不 确定 性 推理 模 
式 。 通 常 把 这 一 类 方法 统称 为 模型 方法 。 

(2) 在 控制 策略 级 处 理 不 确定 性 的 方法 : 其 特点 是 通过 识别 领域 中 引起 不 确定 性 的 
某 些 特征 及 相应 的 控制 策略 限制 或 减少 不 确定 性 对 系统 产生 的 影响 ,这 类 方法 没有 处 理 
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不 确定 性 的 统一 模型 ,其 效果 极 大 地 依赖 于 控制 策略 ,把 这 类 方法 统称 为 控制 方法 。 

模型 方法 又 分 为 数值 方法 及 非 数值 方法 两 类 。 数 值 方法 是 对 不 确定 性 的 一 种 定量 表 
示 和 处 理 方法 。 非 数值 方法 是 指 除数 值 方法 外 的 其 他 各 种 处 理 不 确定 性 的 方法 ,如 古典 
过 辑 方法 和 非 单调 推理 方法 等 。 

在 数值 方法 中 ,概率 方法 是 重要 的 方法 之 一 。 概 率 论 有 着 完善 的 理论 和 方法 ,而 且 具 
有 现成 的 公式 实现 不 确定 性 的 合成 和 传递 ,因此 可 以 用 作 度 量 不 确定 性 的 重要 手段 。 

纯 概 率 方法 虽然 有 严格 的 理论 依据 ,但 通常 要 求 给 出 事件 的 先 验 概率 和 条 件 概率 ,而 
这 些 数据 又 不 易 获得 ,因此 使 其 应 用 受到 限制 。 为 了 解决 这 个 问题 ,人 们 在 概率 论 的 基础 
上 发 展 起 一 些 新 的 方法 和 理论 ,主要 有 主观 概率 论 ( 又 称 主观 Bayes 方法 )、 可 信和 度 方法 、 

(1) 主观 Bayes 方法 : 它 是 PROSPECTOR 专家 系统 中 使 用 的 不 确定 推理 模型 ,是 
对 Bayes 公式 修正 后 形成 的 一 种 不 确定 推理 方法 ,为 概率 论 在 不 确定 推理 中 的 应 用 提供 
了 一 条 途径 。 

(2) 可 信 度 方法 : 它 是 MYCIN 专家 系统 中 使 用 的 不 确定 推理 模型 , 它 以 确定 性 理论 
为 基础 ,方法 简单 、 易 用 。 

(3) 证 据 理论 : 它 通过 定义 信任 函数 、 似 然 函 数 ,把 知道 和 不 知道 区 别 开 。 这些 函 数 
满足 比 概率 函数 的 公理 弱 的 公理 ,因此 ,概率 函数 是 信任 函数 的 一 个 子 集 。 

基于 概率 的 方法 虽然 可 以 表示 和 处 理 现实 世界 中 存在 的 某 些 不 确定 性 ,在 人 工 智能 
的 不 确定 性 推理 方面 占有 重要 地 位 ,但 它们 没有 把 事物 自身 具有 的 模糊 性 反映 出 来 ,也 不 
能 对 其 客观 存在 的 模糊 性 进行 有 效 推理 。Zadeh 等 人 提出 的 模糊 集 理论 及 其 在 此 基础 上 
发 展 的 可 能 性 理论 弥补 了 这 一 缺憾 。 概 率 论 处 理 的 是 由 随机 性 引起 的 不 确定 性 ,可 能 性 
理论 处 理 的 是 由 模糊 性 引起 的 不 确定 性 。 可 能 性 理论 对 由 模糊 性 引起 的 不 确定 性 的 表示 
及 处 理 开 辟 了 一 种 新 的 解决 途径 ,并 得 到 广泛 的 应 用 。 


5.2 ， 非 单调 逻辑 


为 了 形式 地 表述 常识 ,并 在 常识 间 进 行 有 效 的 形式 推理 ,20 世纪 70 年 代 末 ,人 们 提 
出 了 非 单调 逻辑 (non-monotonic logic) 。 

传统 逻辑 系统 都 是 单调 的 ,因为 由 已 知事 实 推出 的 逻辑 结论 绝 不 会 在 已 知事 实 增加 
时 反而 丧失 。 更 形式 地 ,可 定义 逻辑 系统 的 单调 性 如 下 。 

定义 5.1 设 FS 为 一 逻辑 系统 , 称 FS 是 单调 的 (monotonic) ,如 果 对 于 FS 的 任意 公 
式 集 合 Pi ,Ts ,ET 蕴涵 ThCm DISEThCTs)。 这 里 ,ThCT) 表 示 公 式 集 合 (AIF rsA}， 
即 械 的 演绎 结果 的 集合 。 

已 讨论 的 所 有 逻辑 系统 都 是 单调 的 。 可 是 ,常识 推理 却 并 不 具有 这 种 单调 性 。 当 你 
告诉 我 “a 是 一 只 鸟 " 时 ,我 立即 会 据 常识 “ 鸟 是 会 飞 的 ”进行 推理 ,做 出 结论 “a 是 会 飞 的 ”。 
可 当 你 又 告诉 我 “a 是 一 只 能 鸟 ", 我 自然 会 立即 撤回 上 述 结论 ,相反 会 据 常识 “能 鸟 不 会 
飞 ” 而 做 出 结论 “a 是 不 会 飞 的 ”。 如 果 我 足够 机 敏 ,还 应 对 常识 * 鸟 是 会 飞 的 ”做 出 修正 ， 
例如 , 改 为 “ 鸟 是 会 飞 的 ,除非 它 是 能 鸟 ”>。 在 上 述 推理 过 程 中 ,第 一 个 结论 在 已 知事 实 增 
加 时 会 自行 撤销 (而 不 是 仍然 接受 它 ) ,并 修改 推理 的 依据 (而 不 是 让 互相 矛盾 的 依据 共 
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存 , 因 而 被 迫 接受 一 切断 言 )。 

常识 推理 的 这 种 特性 称 为 非 单调 性 .具有 非 单调 性 的 推理 称 为 非 单调 推理 ,而 使 用 非 
单调 推理 的 多 辑 系统 称 为 非 单调 逻辑 。 和 定义 5. 1 相对 ,可 形式 地 定义 非 单调 性 。 

定义 5.2 逻辑 系统 FS 称 为 非 单调 的 ,如 果 存 在 公式 集合 P 和 Ts ,mm SP ,但 
Th(T )FTh(T,)。 

要 使 机 器 具有 智能 ,就 应 当 使 它 具 有 进行 常识 推理 的 能 力 ,具有 依据 "不 完全 的 信息 ” 
和 “不 可 靠 的 经 验 ” 进 行 推理 及 预测 的 能 力 , 因 此 使 机 器 具有 这 种 非 单调 的 逻辑 推理 机 制 
是 非常 必要 的 。 


5.2.1 非 单调 逻辑 的 产生 


非 单调 逻辑 这 个 名 词 的 第 一 次 出 现 , 大 致 是 在 20 世纪 70 年 代 中 期 ,但 在 人 工 智能 对 
推理 机 制 的 模拟 的 研究 中 , 非 单调 推理 的 运用 则 更 早 些 。 
最 早 的 Prolog 版 本 中 就 已 经 有 了 "封闭 系统 假设 ”, 即 当 系 统 推 不 出 A 时 , 便 认 为 
”A 成立 。 当 系统 的 知识 库 扩充 时 ,可 能 推出 A, 那 时 一 A 便 不 再 为 系统 所 接受 。 
PLANNER 系统 则 更 进一步 ,其 中 设 有 运算 THNOT,THNOT(A) 表 示 “ 试 图 证 明 
A, 若 不 成 功 , 则 THNOT(A) 为 真 ”。 不 仅 如 此 ,为 了 便于 在 运行 中 更 新 系统 ,PLANNER 
还 设 有 前 提 表 和 删除 表 , 可 随时 删除 那些 系统 已 经 导出 而 又 在 系统 更 改 后 不 再 成 立 的 
采用 “封闭 系统 假设 ”或 算 符 THNOT 的 方式 都 有 一 个 明显 的 缺点 , 即 必须 保证 “A 
是 否 可 证 ”是 可 判定 的 ,而 这 并 不 总 是 可 以 办 到 的 。 大 家 知道 ,一 阶 逻辑 是 不 可 判定 的 。 
此 外 ,系统 还 可 能 遇 到 “循环 论证 ”的 情况 。 例 如 ,系统 已 知 
A(f(7)) > B(z) 
BCH(z)) > CCz) 
C(f (7)) 一 ACz) 
要 证 Al(a)。 这 时 系统 既 无 法 确定 “A(a) 可 证 ”, 也 无 法 确定 “*A(a) 不 可 证 ”, 因 为 要 证 
A(a) , 须 证 CCF(a)) ,BOC ,AC DD))) ,……, 
在 用 好 辑 演 算 刻画 状态 转换 .动作 规划 时 , 非 单调 性 显得 尤为 重要 ,因为 状态 .动作 都 
不 是 一 成 不 变 的 。 
在 规划 生成 系统 STRIPS 中 ,用 状态 变换 的 规则 模拟 机 器 人 的 动作 。 这 些 规 则 均 由 
3 部 分 组 成 。 
(1) 前 提 , 规 则 执行 的 前 提 。 
(2) 删除 表 ,规则 执行 后 状态 描述 中 应 当 删 除 的 事实 表 。 
(3) 添加 表 ,规则 执行 后 状态 描述 中 应 当 添加 的 事实 表 。 
例 5.1 表示 机 器 人 拾 起 一 块 积木 的 动作 可 用 规则 Pickup(z), 它 由 以 下 3 部 分 
组 成 。 
前 提 : ontable(Cz) (z 在 桌子 上 ) 
clear(z) (zx 上 无 他 物 ) 
handempty (机 械 手 闲置 ) 
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删除 表 : ontable(z) ,clear(z) ,handempty 

添加 表 : holding(z) (机 械 手 持 有 z) 

如 果 图 5-1(a) 的 状态 描述 是 

{ontable(A) ,ontable(B) ,handempty,clear(A) ,clear(B)} 
那么 ,经 过 动作 Pickup(A) 后 ,其 状态 描述 应 为 

{ontable(B) ,clear(B) ,holding(CA)} 


如 图 5-1(b) 所 示 。 
本 站 


A B B 
(a) 机 器 人 拾 起 积木 前 (b) 机 器 人 拾 起 积木 后 
图 5-1 机 器 人 拾 起 一 块 积木 的 动作 前 后 
































在 实际 应 用 中 出 现 的 这 些 处 理 非 单调 性 的 方法 是 很 有 启发 意义 的 ,它们 为 非 单调 逻 
辑 的 出 现 商定 了 基础 。 到 了 20 世纪 70 年 代 后 期 和 80 年 代 初 ,人 们 开始 研究 非 单调 推 
理 ,并 提出 多 种 非 单调 逻辑 系统 , 较 令 人 注目 的 是 Reiter 的 缺 省 推理 逻辑 ,MecDermott 和 
Doyle 的 非 单调 逻辑 系统 。 


5.2.2 缺 省 推理 逻辑 


1977 年 , Reiter 开始 研究 信息 不 完全 时 的 推理 形式 一 一 缺 省 推理 (default 
reasoning)。1980 年 ,他 正式 提出 了 缺 省 推理 迎 辑 。 

下 面 先 用 一 个 例子 说 明 什 么 是 缺 省 推理 。 

例 5.2 如果 我 们 仅 知道 鸟 类 中 只 有 能 鸟 不 会 飞 ,那么 当 听 说 企鹅 是 鸟 类 的 一 种 时 ， 
我 们 会 得 出 “企鹅 会 飞 ” 的 结论 。 像 这 样 的 推理 方式 就 是 一 种 缺 省 推理 。 

分 析 例 5. 2 中 的 推理 可 知 , 缺 省 推理 是 非 单调 的 ,因为 当 我 们 有 了 “企鹅 也 不 会 飞 ” 的 
知识 时 ,就 不 再 会 推出 “企鹅 会 飞 ” 的 结论 了 。 另 外 , 例 5.2 中 的 推理 之 所 以 称 为 缺 省 推 
理 , 是 因为 它 是 依据 如 下 形式 的 规则 进行 的 。 

Bird(Cz) : = 是 鸟 :“z 会 飞 "与 系统 不 矛盾 ) 
fly(x) 工会 飞 

这 就 是 说 : 如 果 工 是 鸟 , 并 且 ”*z 会 飞 ” 与 现 有 知识 不 冲突 (例如 ,系统 只 知道 “能 鸟 不 
会 飞 ”, 而 工 不 是 能 鸟 ) ,那么 可 以 认为 工 是 会 飞 的 。 当 系统 不 知道 企鹅 不 会 飞 时 , 据 此 规 
则 , 便 可 得 出 企 钨 会 飞 的 结论 (因为 企鹅 是 乌 ,企鹅 会 飞 与 现 有 知识 不 矛盾 ) 。 但 是 , 当 系 
统 知 道 企鹅 不 会 飞 时 ,Mfly( 企 鹅 ) 就 不 再 成 立 , 从 而 “企鹅 会 飞 ” 的 结论 就 不 再 能 推出 。 

上 述 形式 的 推理 规则 称 为 缺 省 推理 规则 , 它 的 一 般 形 式 是 

a(2): MB， (2) ,MB (2) 


w(z) 





(5-1) 
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这 里 ,cx(2) ,BCZ) BC) ,rw(z) 均 为 一 阶 逻 辑 中 的 公式 ,它们 所 含 的 自由 变 元 均 


在 = 过 如,…,z, 记 中 。a(z) 称 为 规则 的 先决 条 件 , B.(z) 称 为 规则 的 缺 省 条 件 , wz) 
称 为 规则 的 结论 。 这 种 推理 规则 可 以 说 是 传统 逻辑 中 规则 





a(7) (5-2) 


w(z) 
的 “ 非 音调 化 ”, 因 为 规则 式 (5-2) 可 能 有 许多 例外 (就 像 3 那样 ,引入 MB Cz) 就 


是 为 了 指出 这 些 例外 ,使 它们 随 着 知识 的 增长 而 改变 对 某 些 客体 特性 的 判断 ,从 而 改变 推 
理 的 结果 。MB(z) 中 的 M 常 读 作 “ 可 能 ”,MB;(z) 表 示 就 现 有 知识 而 言 B.(z) 可 能 成 立 ， 
即 =B(Z) 尚 未 出 现 ( 缺 省 )。 

如 果 缺 省 推理 规则 中 不 含 自 由 变 元 , 即 a,MB(i 二 1,2,…,m) ,vw 都 为 命题 ,那么 称 该 
规则 为 闭 规则 。 

定义 5.3 一 个 缺 省 推理 逻辑 理论 (简称 缺 省 理论 或 理论 ) 由 两 部 分 组 成 : 

(1) 缺 省 推理 规则 集 D。 

(2) 公式 集 W, 它 是 已 知 的 或 约定 的 事实 集合 。 

缺 省 理论 常用 二 元 和 撩 <D,W 二 表示 。 当 D 中 的 所 有 规则 是 闭 规则 时 , 称 理论 二 DD， 
W 二 为 闭 理论 。 


缺 省 理论 是 非 单 调 的 。 考 虑 理论 T= 二 二 D,W 二 ,其 中 D= W 二 $8, 那 么 


在 TT 中 可 推出 ,而 当 将 了 A 添 入 W. 使 W 成 为 W =={- 了 A). 使 T 成 为 T'=<D,W' 之 。 
这 时 尽管 T' 是 工 的 扩充 (已 知事 实 集 W' 二 W) ,但 B 却 不 再 能 从 TT 中 推出 。 

当然 ,在 缺 省 理论 中 * 推 出 的 概念 与 传统 逻辑 中 的 “推出 ”概念 是 有 区 别 的 ,前 者 是 非 
单调 推理 ,而 后 者 是 单调 推理 。 为 了 定义 缺 省 理论 中 的 “推出 ”概念 ,我 们 需要 下 列 定义 。 

定义 5.4 设 信 二 二 D,W 二 为 一 闭 的 缺 省 理论 ,T 为 关于 了 的 一 个 算 子 , 作用 于 任 
意 的 命题 集合 S, 而 其 值 为 满足 下 列 3 条 性 质 的 最 小 命题 集合 T(S)。 

(1) WE T(CS)。 

(2) TAT(S))==T(S) ,这 里 Th(T(S)) 为 命题 集 {A| T(S) FA )。 

(3) 如 果 万 中 有 规则 下 人 8 , 目 aE TCS), "BB 5, 那么 WET(S)。 

定义 5.5 命题 集合 下 称 为 关于 的 算 子 了 的 固定 点 (fixed points) ,如果 下 ( 尼 ) 一 
E。 此 时 又 称 玉 为 人 = 二 D,W 二 的 一 个 扩充 。 

有 了 扩充 的 概念 , 便 可 定义 非 单调 的 “推出 ”概念 。 

定义 5.6 ”如果 命题 A 包含 在 缺 省 理论 全 的 一 个 扩充 中 ,那么 称 A 在 人 中 可 非 单调 
地 推出 (以 下 简称 * 推 出” , 记 为 F A( 使 用 符号 FF 是 为 了 区 别 于 ,上 表示 非 单调 的 “推出 ”) 。 

例 5.3 当 D={ 了 站 W 一 # 时 ,一 一 D,W> 无 扩充 ,因为 可 证 关于 人 的 算 子 了 
无 固定 点 。 若 不 然 , 设 巨 为 固定 点 。 ni 如 果 一 AFE, 那 么 据 定 义 5. 4 
之 (3), 7AEE。 如 果 了 AEE, 则 A 必 由 缺 省 规则 过 外 导入 EE( 因 WW=#), 故 -了 AE 


(否则 MA 为 假 ,上 述 规则 不 适用 )。 这 是 一 个 悖 论 。 
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例 5.4 设 D 人 生存 4 那么 A 一 一 D, 凤 之 有 唯一 的 扩充 下 一 
Th({ 一 B, 一 F})。 容 易 验 证 E 为 关于 信 的 本 的 固定 点 , 当 命 题 集 SC{ 一 B,C, 一 F} 而 
S 关 {了 B, 了 FF} 时 ,Th(S) 均 非 工 的 关于 八 的 固定 点 。 
例 5.5 设 
D | 
A C E G 


W= {B,C—>FV A,AAC—-E}, 
那么 <D, 友 > 有 3 个 扩充 : E, = 二 ThA(WU{A,C}),E:=ThA(WU{A,E})),E;= 二 Th(WU 
{C,E,G))。 以 下 仅 对 已 进行 说 明 。 由 于 Th(WU{A,C})) 有 一 EE, 从 而 ThA(WU1{A,C})) 
中 没有 已 和 G( 因 为 ME 和 CAE 不 能 成 立 )。 这 就 是 说 ,D 中 缺 省 规则 在 算 子 的 计算 
过 程 中 无 一 有 用 ,因此 TCTh(WU{A,C}))= 二 Th(WU1{A,C})。 

上 述 例子 说 明 ,并 非 所 有 缺 省 理论 都 有 扩充 ,并 非 有 扩充 的 缺 省 理论 只 有 唯一 的 扩 
充 。 由 此 看 来 , 缺 省 理论 的 扩充 变幻 莫 测 ,但 是 ,有 了 下 述 定理 , 它 便 清 晰 多 了 。 这 一 定理 
还 使 我 们 有 了 一 个 验证 扩充 的 工具 。 

定理 5.1 设 开 为 一 阶 命题 集 , 人 = 二 D, 双 二 为 一 闭 的 缺 省 理论 。 递 归 定 义 已 (一 
1,2,3,…) 如 下 : 

Es =W 




















Em = TE)U fe | 和 E Dya € Ei, -Bs 1B, 引 


那么 ,E 为 A 的 一 个 扩充 当 且 仅 当 E=【) E。 


在 缺 省 理论 的 语 构 研究 方面 已 取得 了 许多 成 果 , 但 它 的 语义 研究 困难 重重 , 至 今 未 见 
今 人 满意 的 语义 结构 被 赋予 这 一 十 分 有 趣 的 推理 理论 。 


5.2.3 非 单调 逻辑 系统 


1978 一 1982 年 ,McDermott 和 Doyle 就 非 单调 推理 发 表 了 好 几 篇 很 有 影响 的 文章 。 
他 们 把 自己 的 系统 称 为 非 单调 逻辑 系统 ,这 一 系统 建立 基于 一 阶 逻辑 之 上 ,并 引进 模 态 词 
M, 用 MA 表示 A 与 当前 已 推 得 的 定理 相 容 (注意 ,在 这 一 点 上 与 缺 省 推理 理论 相似 ) 。 

例 5.6 设 理论 了 有 以 下 3 条 公理 : 

(1) 正 值 中 午 和 人 M( 出 太阳 ) 一 出 太阳 。 

(2) 正 值 中 午 。 

(3) 日 食 一 (出 太阳 ) 。 
那么 ,在 T 中 可 证 : 

(4) 出 太阳 。 
但 是 ,如 果 把 

(5) 日 食 
添 作 公理 ,那么 由 (3) 和 (5) 推 得 ” (出 太阳 ), 这 使 得 M( 出 太阳 ) 不 能 成 立 , 于 是 (4) 不 再 
可 证 。 这 与 传统 逻辑 不 同 。 如 果 把 (1) 改 为 
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(1) “ 正 值 中 午 一 出 太阳 
那么 在 添 人 公理 (5) 时 系统 便 不 一 致 ,从 而 一 切 公式 全 为 系统 的 定理 。 
下 文 将 介绍 ,由 于 在 非 单调 逻辑 中 允许 MA 与 一 般 命 题 一 样 使 用 ( 缺 省 推理 中 ,MA 
只 在 缺 省 推理 规则 中 出 现 ) ,使 它 与 缺 省 推理 理论 有 许多 根本 的 不 同 。 
从 上 例 看 出 , 非 单调 逻辑 系统 的 关键 是 M 意义 的 规定 。 从 语法 角度 规定 ,似乎 可 引 
入 下 列 规 则 (从 M 的 直观 意义 出 发 ) : 
如 果 一 A, 则 MA (5-3) 
但 这 是 不 适当 的 ,因为 这 样 做 等 于 把 一 切 非 定理 的 否定 接受 为 定理 ,没有 什么 非 单 调 可 
言 。McDermott 和 Doyle 的 做 法 是 ,修改 式 (5-3) 为 
如 果 一 A, 则 MA (5-4) 
这 里 的 FEF 表示 与 不 同 的 “推出 ”一 一 非 单调 地 推出 ,并 如 下 规定 -的 意义 。 
以 下 将 加 入 模 态 词 M 的 一 阶 谓词 演算 系统 记 为 FC ,将 允许 使 用 M 的 一 阶 公式 全 体 
记 为 Lrc ,对 任何 公式 集 TSLrc ,Th(T) 的 意义 是 
Th(T)= {AIT rxA} 
定义 5.7 对 任何 公式 集 PTFSLre 定 义 算 子 NMr ,对 任意 公式 集 SELrc 





NMr(S) = Th (T U Asr(S)) (5-5) 
其 中 称 Asr 为 S 的 假设 集 
Asr(S)= {MQIQELr A "QES} (5-6) 
公 
过 
TH(T) =N ({Lre} U {S| NMr(S) = S)) (5-7) 


这 里 门 C={zlYSCSEC-~zES))}。 如 果 PETHCT) ,那么 称 己 可 由 下 非 单调 地 推出 
(可 证 ) ,并 记 为 HP。 

我 们 对 TH(T) 的 定义 式 (5-7) 解 释 如 下 。TH(T) 可 以 说 是 NMr 算 子 的 所 有 固定 点 
的 交 , 当 NMr 无 固定 点 时 ,TH(T) 三 介 ({Lre)) 二 Lre , 即 约定 NMr 无 固定 点 时 ,TH(T) 
为 全 体 FC 公式 的 集合 。 

应 当 指 出 , 算 子 NMr 有 固定 点 时 ,TKP 是 指 P 在 算 子 NMr 的 每 一 个 固定 点 中 。 
这 与 缺 省 推理 理论 不 同 ,P 在 缺 省 理论 信 中 “可 证 ”, 是 指 P 了 属于 作 的 某 一 扩充 , 即 在 算 子 
的 某 一 个 固定 点 中 。 

例 5.7 设 T=FCU {MC 一 C) (FC 指 一 阶 逻 辑 的 公理 ,规则 ,其 中 允许 使 用 M。 
以 下 同 ) ,那么 ,NMr 无 固定 点 。 设 NMr(S)==S', 车 -了 CK S, 那 么 MCE Asr(S), 从 而 
了 CES'; 反 之 ,车 "CES, 那 么 MCG Asr(S), 故 -了 CFS'。 这 就 是 说 ,S' 不 可 能 等 于 5S， 
NMr 无 固定 点 。 

例 5.8 设 T=FCU{AAMB>B,CAMD>D.AVC}, 那 么 NMr 有 唯一 的 固定 
点 ,该 固定 点 含有 BV D, 因 此 有 TKk BV D。 值得 注意 的 是 , 当 缺 省 理论 和信 中 D= 


(人 下 ,人 -Ww={AV CN, 人 也 有 唯一 扩充 (Th(CAV C)), 它 不 全 BV D。 这 一 


差别 便 是 由 非 单调 逻辑 中 把 MB,MD 与 A,C 等 看 作 平 等 的 命题 造成 的 ,这 使 它们 能 代 
人 (A1 一 A;) 人 (As 一 As)(A1V As 一 As) 之 类 的 重 言 式 。 相 反 , 缺 省 推理 就 没有 这 种 
“便利 ”。 
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例 5.9 设 T=FCU{MC>-D,MD 一 -CC}, 那 么 NMr 有 两 个 固定 点 和 Fa ,Ri 
不 含 了 "了 C, 从 而 含有 了 D;F; 不 含 " 了 ,从 而 含 "C。 可 以 验证 己 UP ,PnP 均 非 NMr 
的 固定 点 。 

从 以 上 例子 可 以 看 出 ,NMr 的 固定 点 情况 依赖 于 械 , 它 未 必 有 固定 点 ,并 且 在 有 固定 
点 时 ,固定 点 的 数目 也 未 必 唯 一 。 事实 上 ,NMr 还 可 能 有 无 穷 多 个 固定 点 。 例 如 ,对 一 元 
谓词 PCz) , 令 

T= FCU {Vz MP(z)— (P(x) A Vy(r Ay—> -7P(y)))))} 
那么 , 当 系 统 中 有 无 穷 多 常 元 时 ,NMr 就 有 无 穷 多 个 固定 点 。 设 这 些 常 元 是 m ,as ,as ，…， 
那么 这 无 穷 多 个 固定 点 请 ,F; ,Fi ,… 满 足 
Plai) € Fi AM Pla) € Fi(i=1,2,3,%%,j #0) 
因此 它们 互 不 相同 。 

讨论 命题 时 , 非 单调 逻辑 也 有 一 个 证 明 PH A 的 算法 , 它 类 似 于 命题 演算 的 真 值 表 方 
法 , 仅 适 用 于 醋 为 有 穷 命 题 集 时 。 

研究 表明 , 非 单调 命题 逻辑 的 可 证 性 是 可 判定 的 ,但 一 般 地 , 非 单调 逻辑 的 可 证 性 是 
不 可 判定 的 。 

McDermott 还 对 非 单调 逻辑 的 语义 进行 了 研究 ,他 把 M 看 作 通 常 的 “可 能 " 模 态 词 
(先前 用 心 表示 ) ,这 样 MA 表示 “在 某 一 可 能 世界 中 A 真 ”, 与 MA 在 非 单调 迎 辑 中 的 原 
意 “ 假 定 A 真 与 系统 (可 看 作 现实 世界 ) 不 矛盾 ”相去 较 远 。 因 此 ,McDermott 对 非 单调 旭 
辑 的 语义 规定 不 能 令 人 满意 。 

Doyle 还 给 出 了 一 个 真 值 维护 系统 (Truth Maintenance System,TMS) , 它 可 以 在 机 
器 上 实现 ,以 进行 非 单调 的 推理 。 


s.2.4 非 单调 规则 


在 非 单调 规则 系统 中 ,即使 所 有 前 提 已 知 ,规则 也 可 能 不 会 被 应 用 ,因为 还 必须 考虑 
是 否 同时 存在 与 之 相 蔬 盾 的 推理 。 一 般 来 说 ,下 面 考虑 的 规则 都 称 为 可 废止 的 
(defeasible) ,因为 其 他 规则 可 以 废止 它们 。 为 了 允许 规则 间 的 冲突 ,否定 的 原子 公式 可 
以 出 现在 规则 的 头 或 体 中 。 例 如 ,可 以 有 下 面 的 规则 : 
p(X) > q(X) 
r(X) -> ~g(X) 
下 面 使 用 不 同 的 箭头 区 别 可 废止 规则 和 标准 的 单调 规则 。 
pCX) 三 之 02) 
r(X) =>> gq(X) 
在 这 个 例子 中 ,如 果 同 时 还 给 出 事实 p(a) 、r(a) , 则 根据 非 单调 规则 , 既 推 不 出 g(a)， 
也 推 不 出 了 g(a)。 这 是 一 个 两 条 规则 彼此 阻塞 的 典型 例子 。 这 种 冲突 可 以 通过 使 用 规则 
间 优 先 序 (priorities among rules) 解 决 。 假 设 我 们 知道 由 于 某 些 原因 ,第 一 条 规则 比 第 二 
条 规则 可 靠 ,那么 我 们 可 以 确定 地 推出 g(a)。 
在 实践 中 ,优先 序 的 出 现 是 很 自然 的 ,可 以 基于 各 种 不 同 的 原则 ,例如 : 
(1) 一 条 规则 的 来 源 可 能 比 另 一 条 规则 的 来 源 更 可 靠 或 更 权威 。 例 如 ,在 法 律 领域 ， 
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联邦 法 就 优先 于 州立 法 。 同 样 ,在 商业 经 营 中 ,高 层 管理 部 门 比 中 层 管理 部 门 更 权威 。 

(2) 一 条 规则 可 能 比 男 一 条 规则 更 优先 ,因为 它 在 时 间 上 更 近 。 

(3) 一 条 规则 可 能 比 另 一 条 规则 更 优先 ,因为 它 更 特殊 。 典 型 的 例子 是 一 条 普遍 的 
规则 带 有 一 些 对 例外 情况 的 特殊 规定 ;在 出 现 这 些 例 外 情况 时 ,特殊 规定 比 一 般 规则 本 身 
更 应 当 被 遵守 。 

对 于 给 定 的 一 组 规则 ,特殊 性 通常 可 以 根据 这 些 规 则 计算 出 来 ,但 第 一 条 和 第 二 条 原 
则 无 法 由 逻辑 推理 定义 。 所 以 ,我们 对 具体 的 优先 原则 加 以 抽象 ,假定 存在 规则 集 上 的 一 
种 外 在 优先 关系 (external priority relation) ,用 它 统一 地 刻画 各 种 具体 的 优先 原则 。 为 
了 从 语法 上 表达 这 种 关系 ,拓展 规则 语法 以 包含 一 个 唯一 的 标号 ,例如 : 

rn:p(X) => qa(X) 
re:r(X) => "gq(X) 

于 是 可 以 用 之 rs 表示 ni 比 rs 更 优先 。 

这 里 不 对 二 施加 很 多 条 件 , 甚 至 不 要 求 它 是 规则 间 的 全 序 关系 。 我 们 仅 要 求 优先 关 
系 是 无 环 的 ,也 就 是 不 能 有 如 下 形式 的 环 。 

i ep 

注意 ,优先 关系 是 为 了 解决 竞争 规则 (competing rules) 间 的 冲突 而 引进 的 。 在 简单 
情况 下 , 仅 当 一 条 规则 的 头 是 另 一 条 规则 的 头 的 否定 时 ,这 两 条 规则 才 出 现 竞争 。 但 实际 
应 用 中 未 必 总 是 如 此 ,常见 的 情况 是 , 当 某 个 谓词 被 推出 时 ,不 再 允许 另 一 些 谓词 成 
立 。 例 如 ,一 个 投资 顾问 可 能 将 他 的 建议 建立 在 投资 者 可 以 接受 的 3 种 风险 级 别 上 : 低 、 
中 等 和 高 。 显 然 ,每 个 投资 者 在 任何 给 定时 刻 只 能 选择 一 种 风险 级 别 。 技 术 上 ,可 以 通过 
给 每 个 文字 工 维护 一 个 冲突 集 (conflict set) C(L) 刻 画 这 种 情形 。C(L) 总 是 含有 的 否 
定 , 也 可 以 包含 更 多 文字 。 

定义 5.8 可 废止 规则 (defeasible rule) 有 如 下 形式 : 

rsLis°"*sL, =>L 

其 中 是 标号 (labeD , {Li,…,L,) 是 体 ( 或 前 提 ),L 是 规则 的 头 。 工 ,LL ,…,L, 是 正 
或 负 文字 (一 个 文字 是 一 个 原子 公式 p(4，… ,iw) 或 它 的 否定 了 了 pCa,…,1,))。 在 规则 中 
没有 函数 词 出 现 。 有 时 我 们 用 head(r) 表 示 规 则 的 头 ,body(7) 表 示 体 。 有 时 用 标号 x 指 
代 整 个 规则 ,虽然 这 有 些 不 严格 。 

可 废止 逻辑 程序 (defeasible logic program) 是 一 个 三 元 组 (F,R, 二 ), 包 括 事实 集 下 ， 
可 废止 规则 的 有 限 集 R, 以 及 R 上 的 无 环 二 元 关系 二 (严格 地 说 ,是 7 二 r 的 集合 ,其 中 
是 R 中 规则 的 标号 ) 。 





5.2.5 案例 : 有 经 纪 人 的 交易 


例子 说 明 在 电子 商务 领域 怎样 使 用 规则 。 有 经 纪 人 的 交易 (brokered trade) 通 过 独 
立 的 第 三 方 一 一 经 纪 人 实现 。 经 纪 人 匹配 买 家 的 需求 和 卖家 的 能 力 , 当 双方 都 满意 时 , 提 
议 进行 交易 。 

作为 一 个 具体 应 用 .下面 讨论 公寓 租赁 这 种 常见 但 通常 乏味 耗 时 的 活动 。 适 当 的 网 
络 服务 可 以 相当 大 地 减少 工作 量 。 首 先 给 出 一 个 潜在 租赁 者 的 需求 。 
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左 炯 正在 找 一 个 至 少 45 平方 米 且 至 少 有 两 个 卧室 的 公寓 。 如 果 是 在 三 楼 或 三 楼 以 
上 ,楼 必须 有 电梯 。 而 且 可 以 养 宠物 。 

颜 炯 愿 意 为 市 中 心 的 45 平方 米 大 小 的 公寓 付 900 元 ,为 在 市 部 的 类 似 公 寓 付 750 
元 。 并 且 , 他 愿意 为 公寓 超出 45 平方 米 的 部 分 每 平方 米 支 付 15 元 ,为 花园 每 平方 米 付 
6 元 。 

他 的 付款 总 额 不 会 超过 1200 元 。 在 给 定 的 可 选项 中 ,他 将 选择 最 便宜 的 ,第 二 优先 
的 是 有 花园 的 ,最 后 才 是 有 额外 空间 的 。 

1. 颜 灿 需 求 的 形式 化 描述 

我 们 用 下 面 的 谓词 描述 公寓 的 属性 : 


size(x,y) y 是 公寓 工 的 大 小 (单位 为 平方 米 ) 
bedrooms(x,y) 工 有 > 个 卧室 

price(x,y) y 是 的 价格 

floor(x,y) 工 是 在 第 y 层 楼 
garden(x,y) 工 有 大 小 为 y 的 花园 

lift( x) 在 xz 所 在 的 大 楼 里 有 电梯 
pets(x) 在 zz 里 允许 养 宠物 
central(x) Z 位 于 市 中 心 

我 们 还 使 用 下 面 的 谓词 : 

acceptable( x) 公寓 工 满足 颜 炯 的 要 求 
offer(x,y) 颜 炯 愿意 为 工 付 y 元 


现在 我 们 来 表达 颜 炯 的 需求 。 不 考虑 具体 需求 ,任何 公寓 都 是 可 接受 的 ,表示 为 

ri: 一 二 acceptable(X) 

但 是 ,如 果 颜 炯 的 某 条 要 求 没有 被 满足 , 则 X 就 是 不 可 接受 的 。 

rs: bedrooms(X,Y),Y 一 2 一 二 acceptable(X) 

ra: Size(X,Y),Y 一 45 一 二 acceptable(X) 

rm: 了 pets(X) 一 二 acceptable(X) 

rs: floor(X,Y),Y>2,71ft(X)=> acceptable(X) 

re: price(X,Y),Y>1200=> Tacceptable(X) 

规则 r~~rs 是 对 规则 xr, 的 例外 情况 的 特殊 规定 ,所 以 这 些 规 则 都 比 x 优先 。 

rae>risra>rirn ri rs > rn re>n 

然后 ,给 出 计算 颜 炯 愿意 为 一 个 公寓 支付 的 价钱 的 规则 。 

ri: size(X,Y),Y> 45,garden(X，Z) ,central(X) 一 二 offer(X,900 十 6Z 十 15(Y 一 45)) 

rs: size(X,Y),Y> 45,garden(X，Z) , "central(X)=> offer(X,750 十 6Z 十 15(Y 一 45)) 

仅 当 颜 灿 愿意 付出 的 价钱 少 于 房东 提出 的 价钱 时 ,此 公寓 才 是 可 接受 的 (假设 没有 议 
价 发 生 ) ,这 用 规则 和 优先 序 表示 为 

roe: offer(X,Y),price(X,Z),Y 一 2 三 二 二 acceptable(X) 

ro>n 

2. 可 选 公寓 的 表达 

每 个 可 供 选 择 的 公寓 都 有 唯一 的 名 字 , 它 的 属性 以 事实 形式 表达 。 例 如 ,公寓 a 可 
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以 描述 如 下 。 


bedrooms(al ,1) 

size(a1 ,50) 

central(al) 

floor(ai ,1) 

lift(a) 

pets(a1) 

garden(al ,0) 

Price(al ,900) 

表 5-1 罗列 出 所 有 可 选 公寓 的 描述 。 实 际 应 用 中 , 待 租 公 寓 的 报价 信息 可 以 存储 在 
关系 数据 库 中 。 

如 果 将 颜 炯 的 需求 和 可 选 公寓 的 描述 相 匹配 ,我 们 将 发 现 

(1) 公寓 ai 不 可 接受 ,因为 它 只 有 一 个 卧室 (规则 x,)。 

(2) 公寓 a 和 as 不 可 接受 ,因为 不 许 养 宠物 (规则 x ) 。 

(3) 对 于 az , 颜 炯 愿意 付 900 元 ,但 实际 价格 更 高 (规则 xr; 和 7)。 

(4) 公寓 as as 和 as 是 可 接受 的 (规则 x )。 


表 5-1 可 选 公寓 























flat |bedrooms| size central floor lift pets garden price 
ai 50 是 1 不 是 0 900 
az 2 45 是 0 不 是 0 1005 
as 2 65 不 2 不 是 0 1050 
as 2 55 不 1 是 不 15 990 
as 2 55 是 0 不 是 15 1050 
as 2 60 是 3 不 不 0 1110 
ar 3 65 是 1 不 是 12 1125 


























3. 选择 一 间 公 寓 

至 此 已 经 识别 出 颜 烟 可 以 接受 的 公寓 。 这 个 筛选 是 有 价值 的 ,因为 它 减 少 了 值得 关 
注 的 公寓 数目 , 选 出 来 的 可 以 实地 考察 。 不 过 ,通过 进一步 考虑 颜 烟 的 偏好 
(preferences) ,有 可 能 进一步 减少 公寓 数目 ,直至 减少 到 一 个 。 颜 炯 的 偏好 是 基于 价格 、 
花园 大 小 和 房子 大 小 的 ,而 且 这 3 个 因素 按 顺 序 排列 ,这 可 以 用 规则 和 优先 序 表示 如 下 。 

rio: Cheapest (X) 一 二 rent (X) 

rn: cheapest (X) ,largestGarden(X) =~> rent (X) 

riz : cheapest (X) ,largestGarden(X) ,largest(X) 一 二 rent (X) 


7 全 mo 





ra>rn 


rn>ro 








194 人 工 乔 能 ( 荔 3 了 版) 


此 外 ,我 们 需要 规定 最 多 只 有 一 个 公寓 会 被 租用 。 利 用 其 他 规则 ,从 可 接受 公寓 的 集 
合 可 以 推出 这 些 规则 的 前 提 。 为 了 简单 起 见 , 这 里 只 列 出 该 例子 中 用 到 的 事实 。 

cheapest(as ) 

cheapest(a5 ) 

largest(a;) 

largest(ar) 

largestGarden(as ) 

于 是 ,经 过 下 列 推理 ,可 以 得 出 租用 as 的 决定 。 

(1) 规则 ri 的 前 提 被 as 满足 ,所 以 由 ii 推出 rent(as ) 。 

(2) 规则 mo 的 前 提 被 os 满足 ,所 以 由 mo 推出 rent(as )。 这 就 构成 一 个 冲突 。 但 由 
于 优先 于 mo, 所 以 这 个 冲突 被 化 解 ,rent(as ) 被 rent(ai 六 击败 ”。 换 名 话说 ,mo 在 当前 
情况 下 “失效 ”。 

(3) 这 是 唯一 的 冲突 ,因为 其 他 公寓 都 不 满足 和 ris 的 前 提 。 

这 样 就 做 出 了 一 个 选择 “租用 as”, 颜 烟 马 上 就 能 搬 进 去 。 


5.3 主观 Bayes 方法 


概率 论 被 广泛 用 于 处 理 随 机 性 以 及 人 类 知识 的 不 可 靠 性 ,如 随机 事件 A 的 概率 
P(A) 可 表示 A 发 生 的 可 能 性 大 小 ,因而 可 用 概率 方法 表示 和 处 理事 件 A 的 确定 性 程度 。 
主观 Bayes 方法 是 由 R. 0. Duda 等 人 于 1976 年 在 概率 论 的 基础 上 ,通过 对 Bayes 公式 的 
修正 而 形成 的 一 种 不 确定 性 推理 模型 ,并 成 功 地 应 用 在 他 们 自己 开发 的 地 矿 勘 探 专家 系 
统 PROSPECTOR 中 。 


5.3.1 全 概率 公式 和 Bayes 公式 


在 概率 论 中 ,一 个 事件 或 命题 的 概率 是 在 大 量 统计 数据 的 基础 上 计算 出 来 的 ,并 且 要 
处 理 条 件 概 率 中 复杂 的 证 据 之 间 的 内 在 关系 。 在 使 用 概率 进行 不 确定 推理 中 ,需要 收集 
大 量 的 样本 事件 进行 统计 ,以 便 获得 事件 发 生 的 概率 用 来 表示 命题 的 确定 性 程度 。 然 而 ， 
在 许多 情况 下 ,同类 事件 发 生 的 频率 不 高 ,甚至 很 低 ,无 法 做 概率 统计 ,这 时 一 般 是 根据 观 
测 到 的 数据 , 赁 领域 专家 的 经 验 给 出 一 些 主观 上 的 判断 , 称 为 主观 概率 。 因 此 ,概率 一 般 
可 以 解释 为 对 证 据 和 规则 的 主观 信任 度 。 概 率 推 理 中 起 关键 作用 的 就 是 所 谓 的 Bayes 公 
式 , 它 也 是 主观 Bayes 方法 的 基础 。 

1. Bayes 公式 

定义 5.9( 全 概率 公式 ) 设 有 事件 A, .A,,…,， A, 满足 : 

(1) 任意 两 个 事件 互 不 相 容 ; 

(2) P(A;)>0(i=1,2,.%,n); 

(3) 样本 空间 D 是 所 有 A;(i 二 1,2,…,n) 构 成 的 集合 。 

则 对 任何 事件 B 来 说 ,有 下 式 成 立 : 

P(B)= 王 P(A)。P(CBIA) 十 P(A:)。P(BIA,) 十 … 十 P(A,)。P(CBIA,) 
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全 概率 公式 提供 了 计算 P(B) 的 方法 。 
定义 5.10(Bayes 公式 ) 设 有 事件 A, ,A: ,… ，A, 满足 : 
(1) 任意 两 个 事件 互 不 相 容 ; 
(2) P(A)>0(i=1,2,.…,n); 
(3) 样本 空间 DD 是 所 有 A;(i 二 1,2,…,n) 构 成 的 集合 。 
则 对 任何 事件 BB 来 说 ,有 下 式 成 立 : 
P(B).» P(A; | B)= P(A). P(B|A;:) (i=1,2,.…,n) 


P(Ai) XP(B|A,) 
P(B) 








P(A; | B) (i= 1,2,°,n) 
由 全 概率 公式 得 到 


P(A; | B) = = 1, ,nn 





P(A) x P(B|A) 
2) P(Aj) x PB | A)) 


其 中 ,P(A;) 是 事件 A; 的 先 验 概率 ;P(B|A;) 是 在 事件 A; 发 生 条 件 下 事件 B 的 条 件 概 
率 ;P(A;|1B) 是 在 事件 B 发 生 条 件 下 事件 A; 的 条 件 概 率 , 称 为 后 验 概率 。 

2. 利用 Bayes 公式 进行 推理 

在 专家 系统 中 ,假设 有 如 下 规则 : 

HEThenH 

其 中 ,E 为 前 提 条 件 ,为 结论 。 那 么 条 件 概 率 P(HIE) 就 表示 在 玉 发 生 时 ,H 的 概率 ， 
可 以 用 它 作 为 证 据 巨 出 现时 结论 瓦 的 确定 性 程度 。 

同样 ,对 于 复合 条 件 下 = 已 人 下 人 … 人 和 屯 , ,也 可 以 用 条 件 概率 PCH|E,…E,) 作 为 证 
据 已 ,…,E, 出 现时 ,结论 五 的 确定 性 程度 。 

对 于 产生 式 规则 If E Then HH;, 用 条 件 概率 忆 ( 歼 ;| 已) 作为 证 据 忆 出 现时 ,结论 H; 的 
确定 性 程度 。 根 据 Bayes 公式 ,可 以 得 到 
P(CH;) x PCGE | H,) 


>) PH,)) x P(E|H,) 


这 就 是 说 , 当 已 知 结论 HH, 的 先 验 概率 PCH,) ,并 且 已 知 结论 有 H， (i 二 1,2,…,n) 成 立时 ， 
前 提 条 件 EE 对 应 的 证 据 出 现 的 条 件 概 率 P(EIH;) 就 可 以 用 上 式 求 出 相应 证 据 出 现时 结 
论 H; 的 条 件 概率 P(H;|E)。 

当 有 多 个 证 据 El ,…,E。 和 多 个 结论 Hi ,…, HH, ,并 且 每 个 证 据 都 以 一 定 程度 支持 
每 个 结论 时 ,根据 独立 事件 的 概率 公式 和 全 概率 公式 ,Bayes 公式 可 变 为 
P(E | H;) X P(E, | H;) X +… Xx P(E, | Hi) Xx P(H.,) 


P(H; | E) 





(i= 1,,n) 








P(H: | EL“E,) 





BD) P(E | H;) x PE, | Hj;) XX P(E, | Hj) Xx POH,) 
= 


(i = 1,2,°,n) 
此 时 ,只 要 已 知 H; 的 先 验 概率 P(H;) 以 及 HH; 成 立时 证 据 Ei,…,E, 出 现 的 条 件 概 
率 P(E1|H;),… ,P(E |H;) ,就 可 利用 上 式 计算 出 在 EE,…,E。 出 现 情况 下 互 ; 的 条 件 
概率 P(H;|E,,…,E,)。 
在 实际 应 用 中 ,有 时 这 种 方法 是 很 有 用 的 。 例 如 ,如 果 把 太 ;(i 二 1,2,…,n) 当 作 一 组 
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可 能 发 生 的 疾病 ,把 E;(j 二 1,… ,m) 当 作 相 应 的 症状 ,P(H;) 是 从 大 量 实践 中 经 统计 得 到 
的 疾病 H; 发 生 的 先 验 概率 ,P(E;|H;) 是 疾病 有 H; 发 生 时 观察 到 症状 E; 的 条 件 概 率 , 则 
当 观 察 到 病人 有 症状 EF, ,…,E, 时 ,应 用 上 述 Bayes 公式 就 可 计算 出 PCH;|E,,…,E,)， 
从 而 得 知 病人 患 疾病 H; 的 可 能 性 。 

Bayes 推理 的 优点 是 它 有 较 强 的 理论 背景 和 良好 的 数学 特性 , 当 证 据 和 结论 都 彼此 
独立 时 ,计算 的 复杂 度 比较 低 , 但 是 它 也 有 其 局 限 性 。 


(1) 因为 需要 >》 P(H,) = 1, 如 果 又 增加 一 个 新 的 假设 , 则 对 所 有 的 1 入 7 过 ”十 1， 
PCH,) 都 需要 重新 定义 。 

(2) Bayes 公式 的 应 用 条 件 是 很 严格 的 , 它 要 求 各 事件 互相 独立 ,如 证 据 间 存 在 依赖 
关系 ,就 不 能 直接 使 用 此 方法 。 

(3) 在 概率 论 中 ,一 个 事件 或 命题 的 概率 是 在 大 量 统计 数据 的 基础 上 计算 出 来 的 , 因 
此 尽管 有 时 P(E;|1H;) 比 P(H;|E;) 相 对 容易 得 到 ,但 总 的 来 说 ,要 想得到 这 些 数 据 , 仍 然 
是 一 项 相当 困难 的 工作 。 


5.3.2 主观 Bayes 方 法 


主观 Bayes 方法 是 在 对 Bayes 公式 修正 的 基础 上 形成 的 一 种 不 确定 性 推理 模型 。 

1. 知识 不 确定 性 的 表示 

1) 信任 机 率 

我 们 知道 ,概率 论 考虑 的 是 可 重复 性 的 事件 ,但 是 对 于 许多 不 可 重复 事件 的 概率 ,如 
医疗 上 的 诊断 和 矿产 的 探测 ,每 个 病人 或 矿产 的 位 置 是 不 同 的 ,这 时 必须 扩大 事件 的 范 
围 ,以 便 能 够 处 理 类 似 的 命题 。 例 如 ,一 个 可 能 的 事件 是 : 

“一 个 病人 浑身 长 满 了 红斑 点 ” 
命题 是 : 
“病人 出 麻疹 ” 

设 A 是 一 个 命题 ,条 件 概率 为 P(A1B) 。 

如 果 事 件 或 命题 不 可 重复 或 没有 数学 依据 ,通常 概率 P(A1B) 是 没有 必要 的 。 这 时 
可 以 把 P(A1B) 解 释 为 在 B 成 立时 A 为 真 的 可 信和 度 (degree of belief) 。 

如 果 PCA1B) 二 1, 则 可 以 相信 A 为 真 ; 如 果 PCA1B) 二 0, 则 可 以 相信 A 为 假 。 而 对 
于 其 他 值 0 二 P(A1B) 一 1, 则 表示 不 能 完全 确定 A 是 真 还 是 假 。 在 统计 学 上 ,一 般 认为 
假设 就 是 依据 某 些 证 据 还 不 能 确定 其 真 假 的 命题 ,这 样 可 以 使 用 条 件 概率 表示 似 然 性 
(likelihood) ,如 P(A1B) 表 示 在 证 据 B 的 基础 上 ,假设 A 的 似 然 性 。 

概率 适用 于 重复 事件 ,而 似 然 性 适用 于 表示 非 重 复 事件 中 信任 的 程度 。 一 般 在 专家 
系统 中 ,P( 五 | 已 ) 表 示 在 有 证 据 尼 的 情况 下 ,专家 对 某 种 假设 互 为 真 的 信任 度 。 但 是 ,如 
果 事 件 是 可 重复 的 , 则 P(HIE) 就 表示 概率 。 表 达 这 种 似 然 性 的 方法 可 以 采用 赌博 中 的 
机 率 (ODDS) 方 法 。 

定义 5.11 机 率 定义 如 下 。 

在 某 事件 C 的 前 提 下 ,A 相对 于 B 的 机 率 可 以 表示 为 
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odds = P(A|C)/P(B|O) 
如 果 B= 二 一 A, 则 有 














> PCA 1C) 
ST POATO ”1 一 PCATO) 
用 P 表 示 P(A1C), 则 有 
二 -有 _ _odds 
od 


即 已 知 机 率 可 以 计算 似 然 性 ,反之 亦 然 。 如 果 把 已 解释 为 证 据 X 出 现 的 可 能 性 ,而 
1 一 P 表示 证 据 X 不 出 现 的 可 能 性 ,可 见 ,X 的 机 率 等 于 X 出 现 的 可 能 性 与 X 不 出 现 的 
可 能 性 之 比 。 用 PCX) 表 示 X 出 现 的 可 能 性 ,O(X) 表 示 X 的 机 率 。 显 然 , 随 着 P(X) 的 
增 大 ,OCX) 也 在 增 大 ,并且 





P(X) 一 0 时 有 OCX) 一 0 
P(X) 二 1 时 有 OCX) = co 
这 样 ,就 可 以 把 取 值 为 [0,1] 的 PCX) 放 大 到 取 值 为 [0, 十 c=) 的 OCX) 。 
概率 通常 和 演绎 问题 一 起 使 用 , 即 处 理 在 相同 的 假设 下 ,一 系列 不 同事 件 E; 均 可 能 
发 生 的 问题 。 概 率 本 质 上 是 正 向 链 或 演绎 的 ,而 似 然 性 则 是 反 向 链 或 归纳 的 。 虽 然 对 概 
率 和 似 然 性 使 用 同样 的 符号 ,但 应 用 却 不 同 , 通 常 我 们 说 : 一 种 假设 下 的 似 然 性 ,或 一 个 
事件 的 概率 。 
2) 充分 性 和 必然 性 
由 Bayes 公式 可 知 : 


pe 1. = ELDXPUD 

















P(E) 
P(E| ~-H)xP("H) 
P(-HI|E) PE 
将 两 式 相 除 ,得 
P(H|E) P(E|H) \_P(H) C68) 
P(-HIE) P(E| -~-H)’ POH) 
根据 机 率 定义 : 
__P(X) 更 __PCX) _ 
OD= PE 00 = praxy (5-9) 
将 式 (5-9) 代 入 式 (5-8) ,有 
__P(E|IH) 
OH IE) = pT -=H Xo (5-10) 
其 中 ,O(H) 和 OCHIE) 分 别 表示 互 的 先 验 机 率 和 后 验 机 率 。 
定义 似 然 率 (likelihood ratio)LS 如 下 。 
P(E HY 
~ P(E|-H) a 
将 式 (5-11) 代 入 式 (5-10) ,可 得 
O(H|E)= LSXxOCH) (5-12) 
即 LS =O(HIE)/O(H) (5-13) 





式 (5-12) 称 为 Bayes 定理 的 机 率 似 然 性 形式 。 因 子 LS 称 为 充分 似 然 性 ,因为 如 果 
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LS 二 吕 , 则 证 据 EE 对 于 推出 互 为 真是 逻辑 充分 的 。LS 为 规则 的 充分 性 量度 , 它 反映 玉 
的 出 现 对 互 的 支持 程度 。 当 LS 二 1 时 ,E 对 惠 没 影响 ; 当 LS>1 时 ,已 支持 互 , 且 工 S 越 
大 ,EE 对 五 的 支持 越 充分 ,车 LS 为 c= , 则 下 为 真 时 互 就 为 真 ; 当 LS<1 时 ,下 排斥 互 , 若 
LS 为 0, 则 下 为 真 时 互 就 为 假 。 

同 理 , 可 得 到 关于 工 N 的 公式 

LN=P(-E|H)/P(-E|-H) (5-14) 
O(H| -E)= LN xO(H) (5-15) 

式 (5-15) 称 为 Bayes 定理 的 必然 似 然 性 形式 。 如 果 LN==0, 则 有 O( 互 | 一 E)=0。 
这 说 明 当 一 尼 为 真 时 ,五 必 假 。 也 就 是 说 ,如 果 巨 不 存在 , 则 互 为 假 , 即 已 对 互 来 说 是 
必然 的 。LN 为 规则 的 必要 性 量度 , 它 反 映 卫 EE 对 惠 的 支持 程度 , 即 下 的 出 现 对 互 的 必 
要 性 。 当 LN=1 时 ,了 -EE 对 日 没 影响 ; 当 LN>1 时 , -EE 支持 电 , 且 LN 越 大 ,一 正 对 
互 的 支持 越 充 分 , 若 LN 为 =, 则 一 巨 为 真 时 顾 就 为 真 ; 当 LN<1 时, =-E 排 斥 玉 ,车 
LN 为 0, 则 一 EE 为 真 时 五 就 为 假 。 

式 (5-12) 和 式 (5-15) 就 是 修改 的 Bayes 公式 。 从 这 两 个 公式 可 以 看 出 : 当 巨 为 真 
时 ,可 以 利用 LS 将 互 的 先 验 机 率 O( 互 ) 更 新 为 其 后 验 机 率 OC(HIE); 当 E 为 假 时 ,可 以 
利用 LN 将 的 先 验 机 率 O( 互 ) 更 新 为 其 后 验 机 率 OC(H| 一 EE)。 

3) 规则 表示 方式 

在 主观 Bayes 方法 中 ,规则 是 用 产生 式 表示 的 ,其 形式 为 

IF E THEN (LS,LN) H 

其 中 ,CLS,LN) 用 来 表示 该 规则 的 强度 。 

在 实际 系统 中 ,LS 和 LN 的 值 均 是 由 领域 专家 根据 经 验 给 出 的 ,而 不 是 计算 出 来 的 ; 
当 证 据 玉 愈 是 支持 厅 为 真 时 , 则 LS 的 值 应 该 愈 大 ; 当 证 据 已 对 万 愈 是 必要 时 , 则 相应 
的 LN 的 值 应 该 愈 小 。 因 此 ,公式 LS 和 LN 除了 在 推理 过 程 中 使 用 以 外 ,还 可 以 作为 领 
域 专 家 为 LS 和 LN 赋值 的 依据 。 

2. 证 据 不 确定 性 的 表示 

证 据 通 常 可 以 分 为 全 证 据 和 部 分 证 据 。 全 证 据 就 是 所 有 的 证 据 , 即 所 有 可 能 的 证 据 
和 假设 ,它们 组 成 证 据 巨 。 部 分 证 据 S 就 是 我 们 所 知道 的 EE 的 一 部 分 ,这 一 部 分 证 据 也 
可 以 称 为 观察 。 一 般 地 ,全 证 据 的 可 信 度 依赖 于 部 分 证 据 , 表 示 为 P(E|S)。 如 果 知 道 所 
有 的 证 据 , 则 E=S, 且 有 PCEIS)=P(E)。 其 中 ,PCE) 就 是 证 据 忆 的 先 验 似 然 性 ,PCE1S) 
是 已 知 全 证 据 EE 中 部 分 知识 S 后 对 E 的 信任 ,为 E 的 后 验 似 然 性 。 

在 主观 Bayes 方法 中 ,证 据 EE 的 不 确定 性 可 以 用 证 据 的 似 然 性 或 机 率 表示 。 似 然 率 
与 机 率 之 间 的 关系 为 

当 瑟 为 假 时 
OUB) 一 一 | 当 玉 为 真 时 
(0, 十 cc=) 当 瓦 非 真 也 非 假 时 

原始 证 据 的 不 确定 性 通常 由 用 户 给 定 ,作为 中 间 结 果 的 证 据 , 可 以 由 下 面 的 不 确定 性 
传递 算法 确定 。 

3. 组 合 证 据 不 确定 性 的 计算 

当 组 合 证 据 是 多 个 单一 证 据 的 合 取 时 , 即 
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下 =E，AND E, AND … AND E, 
如 果 已 知 在 当前 观察 S 下 ,每 个 单一 证 据 E; 都 有 概率 P(E,|S),P(CE:|S),…,P(CE,| 
S), 则 
P(E|S)=min{P(E|S),P(E,|S),.…,P(E,|S)} 
当 组 合 证 据 是 多 个 单一 证 据 的 析 取 时 , 即 
E=E, OR E, OR … OR E, 
如 果 已 知 在 当前 观察 S 下 ,每 个 单一 证 据 E; 都 有 概率 P(E,|1S) ,P(E,1S),…,P(E, 
1S) , 则 
P(E|S)=max{ P(E,1S),P(CE:|1S),…,PCE,|S)} 
对 于 *“ 非 ?运算 ,用 下 式 计 算 : 
P(-E|IS)=1—P(E|S) 
4. 不 确定 性 的 传递 算法 
主观 Bayes 方法 推理 的 任务 就 是 根据 记 的 概率 P(E) 及 LS、LN 的 值 ,把 互 的 先 验 
概率 (或 似 然 性 )P(H) 或 先 验 机 率 O( 瑟 ) 更 新 为 后 验 概率 (或 似 然 性 ) 或 后 验 机 率 。 由 于 
一 条 规则 对 应 的 证 据 可 能 肯定 为 真 ,也 可 能 肯定 为 假 ,还 可 能 既 非 真 又 非 假 ,因此 ,在 把 
H 的 先 验 概率 或 先 验 机 率 更 新 为 后 验 概率 或 后 验 机 率 时 ,需要 根据 证 据 的 不 同情 况 计算 
其 后 验 概率 或 后 验 机 率 。 下 面 分 别 讨论 这 些 不 同情 况 。 
1) 证 据 肯定 为 真 
当 证 据 巨 肯定 为 真 , 即 全 证 据 一 定 出 现时 ,P(E) 二 P(E|S)==1。 将 互 的 先 验 机 率 更 
新 为 后 验 机 率 的 公式 为 
O(HIE)=LSXO(H) 
如 果 是 把 玉 的 先 验 概率 更 新 为 其 后 验 概率 , 则 根据 机 率 和 概率 的 对 应 关系 有 


LSXxP(H) 
(LS—1YXPCHY+L 


这 是 把 先 验 概率 P( 末 ) 更 新 为 后 验 概率 PCHIE) 的 计算 公式 。 
2) 证 据 肯 定 为 假 
当 证 据 玉 肯定 为 假 , 即 证 据 不 出 现时 ,P(E) 二 P(E|S)==0,P( 了 -E)==1。 将 理 的 先 
验 机 率 更 新 为 后 验 机 率 的 公式 为 
O(HI-E)=LNXO(H) 
如 果 是 把 五 的 先 验 概率 更 新 为 其 后 验 概率 , 则 有 
P(H|I-E)=LNXP(H)/((LN—1)XP(H)+1) 
这 是 把 先 验 概率 P( 互 ) 更 新 为 后 验 概率 P(H| ”~ 巨 ) 的 计算 公式 。 
3) 证 据 既 非 真 又 非 假 
当 证 据 既 非 真 又 非 假 时 ,不 能 再 用 上 面 的 方法 计算 互 的 后 验 概率 。 这 时 因为 互 依 
赖 于 证 据 玉 ,而 EE 基于 部 分 证 据 S, 则 P(CHIS) 是 互 依 赖 于 S 的 似 然 性 。 根 据 条 件 概率 : 
P(H|IS)=P(H,S)/P(S) 


P(HIE)= 


可 以 推出 
PH]SY=PCHIEYXP(EISYF PHI "EXP(™E]LS) 
可 以 利用 上 面 的 公式 计算 在 证 据 不 确定 的 情况 下 ,不 确定 性 的 传递 问题 。 
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下 面 分 4 种 情况 讨论 这 个 公式 。 

©@ PCIS)=1。 
当 P(E1S)=1 时 ,P( 了 EI|S)=0, 则 有 

LSXP(H) 
(LS—1)XP(H)+1 








P(HIS)=P(HIE) 
这 实际 上 就 是 证 据 肯 定 存在 的 情况 。 
©® P(E|IS)=0。 
当 P(E1S)==0 时 ,P(~E|IS)==1, 则 有 


LNXP(H) 
(LN—DXP(H)+! 








P(HIS)=P(HI-E) 
这 实际 上 是 证 据 肯 定 不 存在 的 情况 。 
Q@ P(E|IS)=P(E). 
当 P(E1S)==P(E) 时 ,表示 EE 与 S 无 关 。 由 全 概率 公式 可 得 : 
P(H|S)= P(H|E)XxP(E|S)+P(H| -+E)xP(-E|S) 
= P(H|E)xP(E)+P(H| -+E)xP(-E) = P(H) 
通过 上 述 分 析 , 已 经 得 到 P(E|S) 上 的 3 个 特殊 值 0,P(E) 及 1, 并 分 别 取 得 了 对 应 
值 P(HI ~-E),P(H) 及 P(HIE)。 这 样 就 构成 了 3 个 特殊 点 。 
@ P(E|S) 为 其 他 值 。 
当 P(E|S) 为 其 他 值 时 ,P(E|S) 的 值 可 通过 上 述 3 个 特殊 点 的 分 段 线 性 插值 函数 求 
得 。 该 分 段 线 性 插值 函数 PC(H|S) 如 图 5-2 所 示 , 函 数 的 解析 表达 式 为 
P(H)—P(HI7E 






达 










P(HI-E)+ 碾 议 ;xP(EIS)， ”车 0<P(E|S)<P(E) 
Ps PCHIE)—P(HD) 
PAD + Sp XLP(EIS)—P(E)]J, 车 P(E)S<P(EIS)<1 
P(HIS) 
PHIE) 
PM 





PES) 


图 5-2 分 段 线 性 插值 函数 


5. 结论 不 确定 性 的 合成 

假设 有 条 知识 都 支持 同一 结论 玉 , 并 且 这 些 知 识 的 前 提 条 件 分 别 是 个 相互 独立 
的 证 据 E; ,Es,… ,EE, ,而 每 个 证 据 对 应 的 观察 又 分 别 是 Si ,5S ,…,S,。 在 这 些 观察 下 , 求 
五 的 后 验 概率 的 方法 是 : 首先 对 每 条 知识 分 别 求 出 互 的 后 验 机 率 是 O( 互 |S;) ,然后 利用 
这 些 后 验 机 率 并 按 下 述 公 式 求 出 所 有 观察 下 互 的 后 验 机 率 。 


OHIS) 、OCH1S:) \... OCH|S,) 
OD “~ OD OD 





O(H1S Se… 5S,) 





XO(H) 
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例 5.10 设 有 规则 
r: If E, Then (20,1) H 
rs: If E, Then (300,1) H 
已 知 证 据 已 和 E, 必然 发 生 ,并 且 P( 昌 )= 二 0.03, 求 瓦 的 后 验 概率 。 
解 : 因为 PCH) 二 0.03, 则 
O(H)=0.03/(1—0.03)=0.030927 


根据 xr 有 : 

O(HIE)=LS: XO(H)=20X0.030927=0. 6185 
根据 r。 有 : 

O(H|E;)=LS; XO(H)=300X0.030927=9. 2781 
那么 


OC(H | E,) x QH | E,) 
OH) OH) 


= 0.6185 X 9.2781/0.030927 = 185. 55 
P(H | EE,)= 185.55/(1 二 185.55) = 0.99464 

主观 Bayes 方法 具有 下 述 优点 : 该 方法 基于 概率 理论 ,具有 坚实 的 理论 基础 ,是 目 
前 不 确定 推理 中 最 成 熟 的 方法 之 一 ; @ 计 算 量 适中 。 

但 是 ,该 方法 也 有 不 足 之 处 : 要 求 有 大 量 的 概率 数据 构造 知识 库 , 并 且 难 于 对 这 些 
数据 进行 解释 ; @ 在 原始 证 据 具 有 相互 独立 性 ,并 能 提供 精确 且 一 致 的 主观 概率 数据 的 
情况 下 ,该 方法 可 以 令 人 满意 地 处 理 不 确定 推理 。 但 在 实际 中 ,这 些 概率 值 很 难保 证 一 
致 性 。 


5.4 确定 性 理论 


确定 性 理论 (confirmation theory) 是 由 美国 斯 坦 福 大 学 E. H. Shortliffe 等 人 在 考察 
了 非 概率 的 和 非 形式 化 的 推理 过 程 后 于 1975 年 提出 的 一 种 不 确定 性 推理 模型 ,并 于 
1976 年 首次 在 血液 病 诊 断 专 家 系统 MYCIN 中 得 到 了 成 功 应 用 。 在 确定 性 理论 中 ,不 确 
定性 是 用 可 信 度 表示 的 ,因此 人 们 也 称 其 为 可 信 度 方法 。 它 是 不 确定 性 推理 中 非常 简单 
且 又 十 分 有 效 的 一 种 推理 方法 。 尽 管 该 方法 未 建立 在 严格 的 理论 推导 基础 上 ,但 对 于 许 
多 应 用 领域 , 仍 可 以 得 到 比较 合理 和 令 人 满意 的 结果 。 目 前 ,有 许多 成 功 的 专家 系统 都 是 
基于 这 一 方法 建立 起 来 的 。 





O(H | EE;) x OH) 











5.4.1 建造 医学 专家 系统 时 的 问题 


1. Bayes 方法 的 问题 

医疗 诊断 问题 和 地 质问 题 一 样 都 具有 不 确定 性 ,主要 的 不 同 是 由 于 自然 界 中 总 共 才 
有 92 种 天 然 元 素 , 所 以 关于 矿物 的 地 质 假设 数目 就 是 有 限 的 。 但 是 ,由 于 微生物 的 数量 
巨大 ,因此 可 能 的 疾病 假设 也 更 多 。 

虽然 Bayes 定理 在 医学 上 很 有 用 ,但 是 它 的 准确 性 和 事先 知道 有 多 少 种 可 能 性 有 关 。 
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例如 ,给 定 一 些 症状 ,使 用 Bayes 定理 确定 某 种 疾病 的 概率 : 
P(E | DD)P(CD) P(E | D)P(D;) 
P(E) DPE | D)PD,) 


其 中 ,D; 是 第 i 种 疾病 ;E 是 证 据 ;P(D;) 是 在 已 知 任何 证 据 之 前 病人 得 这 种 病 的 先 
验 概率 ;P(E|D;) 是 在 已 知 患 有 D; 疾病 的 情况 下 ,病人 出 现 症 状 E 的 条 件 概 率 ;5 是 对 
所 有 疾病 求 和 。 

一 般 来 说 ,要 给 出 所 有 这 些 概率 一 致 的 .完整 的 值 往往 是 不 可 能 的 。 实 际 上 ,这 些 概 
率 或 统计 是 在 数据 或 信息 不 断 积累 的 基础 上 得 到 的 ,并 且 随 着 证 据 一 点 一 点 的 积累 ,又 会 
增加 新 的 概率 需要 计算 或 统计 ,以 确定 证 据 积累 时 病人 患 某 种 疾病 的 可 能 性 。 

2. 信任 与 不 信任 问题 

信任 与 不 信任 问题 是 设计 医学 诊断 专家 系统 时 面临 的 又 一 个 问题 。 可 信 度 是 对 信任 
的 一 种 度量 ,是 指 人 们 根据 以 往 经 验 对 某 个 事物 或 现象 为 真 的 程度 的 一 个 判断 ,或 者 说 是 
人 们 对 某 个 事物 或 现象 为 真 的 相信 程度 。 根 据 概率 论 ,我 们 知道 

P(H)+P(~"H)=1 











PD | E) 


于 是 有 P(H)=1 一 P(-H) 
对 于 基于 证 据 忆 的 后 验 假设 ,有 
P(HIE)=1 一 P(” 五 |E) 
把 上 式 用 于 医学 专家 系统 中 ,如 对 于 MYCIN 中 的 规则 
规则 1: If 生物 体 的 染色 呈 革 兰 氏 阳性 ,并 且 
@ 生物 体 的 形态 为 球形 ,并 且 
@ 生物 体 生长 构造 是 链 状 
Then 有 证 据 表 明 (0.7) 这 种 生物 是 链球 菌 
也 就 是 说 ,如 果 3 个 前 提 条 件 都 满足 ,就 有 70% 的 可 能 确定 它 是 一 种 链球 菌 : 
P(HIEE;,E;)=0.7 
医学 专家 认为 上 式 是 可 以 接受 的 ,但 是 医生 认为 下 式 是 不 正确 的 。 
P(-HIE,E,E,)=1—0.7=0.3 

这 说 明 0.7 和 0.3 反映 的 不 是 信任 的 概率 ,而 只 是 一 种 似 然 性 。 

出 现 这 个 问题 的 根本 原因 在 于 ,尽管 P( 互 ) 表 明正 和 瓦 存在 一 种 因果 关系 ,但 ”万 
入 之 间 可 能 没有 因果 关系 。 但 是 ,P( 五 | 已 )=1 一 P(” 互 | 屯 ) 却 暗示 如 果 瑟 和 瓦 之 间 
有 因果 关系 , 则 正和 ”~ 瓦 之 间 也 有 因果 关系 。 

正 是 由 于 概率 论 上 的 这 些 问 题 使 得 MYCIN 专家 系统 的 开发 者 需要 建立 新 的 模型 处 
理 不 确定 性 问题 。 这 种 模型 和 基于 重复 事件 出 现 频率 有 关 的 普通 概率 不 同 , 它 基于 利用 
某 些 证 据 去 证 实 假设 的 方法 , 称 为 基于 认 知 概率 或 确认 度 的 确定 性 理论 。 


5.4.2 C-F 模型 
C-F 模型 是 Shortliffe 等 人 在 开发 细菌 感染 疾病 诊断 专家 系统 MYCIN 中 提出 的 一 


种 不 确定 性 推理 模型 , 它 是 基于 确定 性 理论 ,结合 概率 论 和 模糊 集合 论 等 方法 提出 的 一 种 
推理 方法 。 该 方法 采用 确定 性 因子 (Certainty Factor,CF) 作 为 不 确定 性 的 测度 ,通过 对 
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CF( 互 ,E) 的 计算 ,探讨 证 据 已 对 假设 五 的 定量 支持 程度 ,因此 ,该 方法 也 称 为 C-F 模型 。 

下 面 首先 讨论 在 C-F 模型 中 ,关于 信任 与 不 信任 的 处 理 方法 。 

1. 可 信 度 的 定义 

在 C-F 模型 中 ,确定 性 因子 最 初 定义 为 信任 与 不 信任 的 差 , 即 CF( 玉 ,EE) 定 义 为 

CF(H,E)=MB(H,E)—MD(H,E) 
其 中 ,CF 是 由 证 据 E 得 到 假设 互 的 确定 性 因子 ;MB 称 为 信任 增长 度 ,表示 因为 与 前 提 
条 件 正 匹配 的 证 据 的 出 现 ,使 结论 互 为 真 的 信任 的 增长 程度 。MB( 互 ,下 ) 定 义 为 
本 P(H)=1 


max{P(HIE),P(H)}—P(H) 
EEC 


MD 称 为 不 信任 增长 度 ,表示 因 为 与 前 提 条 件 已 匹配 的 证 据 的 出 现 , 对 结论 互 的 不 
信任 的 增长 程度 。MD(FH,E) 定 义 为 
ls P(H)=0 


min{P(HIE),P(H)}—P(H) 
-Pt . 


在 以 上 两 个 式 子 中 ,P(H) 表 示 五 的 先 验 概率 ;PC(HIE) 表 示 在 前 提 条 件 E 所 对 应 的 
证 据 出 现 的 情况 下 ,结论 五 的 条 件 概率 。 由 MB 与 MD 的 定义 可 以 得 出 如 下 结论 。 

当 MB(H,E) 记 0 时 ,有 P(H,E) 宝 P(H), 这 说 明 由 于 EE 对 应 的 证 据 的 出 现 增加 了 
的 信任 程度 ,但 不 信任 程度 没有 变化 。 

当 MD(H,E) 记 0 时 ,有 PC(H,E) 二 P(H), 这 说 明 由 于 EE 对 应 的 证 据 的 出 现 增 加 了 
巨 的 不 信任 程度 ,而 不 改变 对 其 信任 的 程度 。 

根据 前 面 对 CF( 有 H,E)、MB(HH,E)、MD(H,E) 的 定义 ,可 得 到 CF( 互 ,已 ) 的 计算 


MB(H,E)= 








P(H)A1 


MD(H,E)= 








P(H)A0 


_PCHIE) 一 PCH) 


MB(H,E)—0 车 PC(HIE)>>P(H) 








1—POHD) 
CF(H,E)=1o 车 P(HIE)=P(H) 
0—MD(H,E) Os 车 P(HIE)<P(HD) 


从 上 面 的 公式 可 以 得 出 以 下 结 t 

车 CF( 有 H,E) 放 0, 则 PCHIE) 记 PC(H)。 说明 由 于 前 提 条 件 EE 所 对 应 证 据 的 出 现 增 
加 了 五 为 真 的 概率 , 即 增加 了 瑟 的 可 信和 度 ,CF(H,E) 的 值 越 大 ,增加 互 为 真 的 可 信 度 
就 越 大 。 

车 CF( 理 ,E)<<0, 则 PC(HIE) 二 P(H)。 这 说 明 由 于 前 提 条 件 EE 所 对 应 证 据 的 出 现 
减少 了 互 为 真 的 概率 , 即 增加 了 互 为 假 的 可 信和 度 ,CF( 互 ,已 ) 的 值 越 小 ,增加 互 为 假 的 
可 信 度 就 越 大 。 

根据 以 上 对 CFMB MD 的 定义 ,可 得 到 它们 的 如 下 性 质 。 

1) 互 斥 性 

对 同一 证 据 , 它 不 可 能 既 增 加 对 互 的 信任 程度 ,又 同时 增加 对 互 的 不 信任 程度 ,这 
说 明 MB 与 MD 是 互 斥 的 , 即 有 如 下 互 斥 性 : 

当 MB(H,E)>0 时 ,MD(H,E)=0 
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当 MD( 瓦 ,BE) 二 0 时 ,MB( 五 ,BE) 王 0 

2) 值 域 

0<MB(H,E)<I 

0<MD(H,E)<I1 

—1<CF(H,E)<I 

3) 典型 值 

@ 当 CF(H,E)==1 时 ,有 PCHIE) 二 1, 说 明 由 于 EE 所 对 应 证 据 的 出 现 使 瑟 为 真 。 
此 时 ,MB(H,E)=1,MD(H,E)=0。 

@ 当 CF(H,E)== 一 1 时 ,有 P(HIE)==0, 说 明 由 于 EE 所 对 应 证 据 的 出 现 使 末 为 
假 。 此 时 ,MB(H,E)=0,MD(H,E)=1。 

@ 当 CF(H,E)==0 时 , 则 P(HIE)= 二 P(H) ,表示 理 与 E 独立 , 即 EE 所 对 应 证 据 的 
出 现 对 互 没有 影响 。 

4) 对 瓦 的 信任 增长 度 等 于 对 非 互 的 信任 增长 度 














根据 MB .MD 的 定义 及 概率 的 性 质 
, _ PC-HIE)—P(-HH)_ 4 一 PCGHIE)) 一 (1 一 PCH)) 
MD(” 互 ,PE) =- PC-H) —0— PH)) 
—P(HI|E)+P(H) 
一 (1 二 PCD)) MR ERE) 


再 根据 CF 的 定义 及 MB .MD 的 互 斥 性 ,有 
CF(H,E)+CF(-7H,E)= (MB(H,E)— MD(H,E))+ (MB(7H,E)— 
MD(-H,E)) 
= (MB(H,E)—0)+(0—MD(-H,E)) 
= MB(H,E)— MD(-H,E)=0 
该 公式 说 明了 以 下 3 个 问题 。 
Q@ 对 万 的 信任 增长 度 等 于 对 非 林 的 不 信任 增长 度 。 
@ 对 万 的 可 信 度 与 对 非 瓦 的 可 信 度 之 和 等 于 0。 
@ 可 信 度 不 是 概率 。 对 概率 有 
P(H)+P(-H)=1 有 0<P(H),P(-H)<I 
而 可 信 度 不 满足 此 条 件 。 
5) 对 同一 前 提 已 , 若 支 持 多 个 不 同 的 结论 H;(i 二 1,2,… ,nn) , 则 
DCF(H,E)<I1 
i=1 
因此 ,如 果 发 现 专家 给 出 的 知识 有 如 下 情况 : 
CF(H ,EY)=0.7,CE(H EI=0:.4 
则 因 0.7 十 0. 4 二 1. 11 为 非法 ,应 进行 调整 或 规范 化 。 
最 后 需要 指出 ,在 实际 应 用 中 ,P( 有 H) 和 P(HIE) 的 值 是 很 难 获得 的 ,因此 CF(H,E) 
的 值 应 由 领域 专家 直接 给 出 。 其 原则 是 : 车 相应 证 据 的 出 现 会 增加 互 为 真 的 可 信和 度 , 则 
CF( 瓦 , 尼 ) 过 0, 证据 的 出 现 对 互 为 真 的 支持 程度 越 高 , 则 CF( 互 ,已 ) 的 值 越 大 ;反之 ,证 据 
的 出 现 减 少 互 为 真 的 可 信和 度 , 则 CF( 玉 ,E) 过 0, 证 据 的 出 现 对 互 为 假 的 支持 程度 越 高 ， 
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就 使 CF( 互 ,已 ) 的 值 越 小 ; 若 相应 证 据 的 出 现 与 五 无 关 , 则 使 CF(H,E) 一 0。 

2. 确定 性 因子 的 计算 

1) 规则 不 确定 性 的 表示 

在 C-F 模型 中 ,规则 是 用 产生 式 规 则 表示 的 ,其 一 般 形式 为 

If E Then H (CF(H.,E)) 

其 中 ,已 是 规则 的 前 提 条 件 ; 互 是 规则 的 结论 ;CF( 互 ,E) 是 规则 的 可 信和 度 , 也 称 为 规则 强 
度 或 知识 强度 , 它 描述 的 是 知识 的 静态 强度 。 这 里 ,前 提 和 结论 都 可 以 由 复合 命题 组 成 。 

2) 证 据 不 确定 性 的 表示 

在 CF 模型 中 ,证 据 巨 的 不 确定 性 也 是 用 可 信和 度 因 子 CF(E) 表 示 的 ,其 取 值 范 围 同 
样 是 [一 1,1], 其 典型 值 为 

当 证 据 巨 肯定 为 真 时 : CFCE) 一 1; 

当 证 据 巨 肯定 为 假 时 : CFCE) 一 一 1; 

当 证 据 玉 一 无 所 知 时 : CF(E) 二 0。 

证 据 可 信 度 的 来 源 有 以 下 两 种 情况 : 如 果 是 初始 证 据 , 其 可 信 度 是 由 提供 证 据 的 用 
户 给 出 的 ;如 果 是 先前 推出 的 中 间 结 论 又 作为 当前 推理 的 证 据 , 则 其 可 信 度 是 原来 在 推出 
该 结论 时 由 不 确定 性 的 更 新 算法 计算 得 到 的 。 

CF(E) 描 述 的 是 证 据 的 动态 强度 。 尽 管 它 和 知识 的 静态 强度 在 表示 方法 上 类 似 , 但 
二 者 的 含义 却 完全 不 同 。 知 识 的 静态 强度 CF( 互 ,已 ) 表 示 的 是 规则 的 强度 , 即 当天 对 应 
的 证 据 为 真 时 对 互 的 影响 程度 ,而 动态 强度 CF(E) 表 示 的 是 证 据 已 当前 的 不 确定 性 

3) 组 合 证 据 不 确定 性 的 计算 

对 证 据 的 组 合 形式 可 分 为 “ 合 取 ”与 “ 析 取 ”两 种 基本 情况 。 当 组 合 证 据 是 多 个 单一 证 
据 的 合 取 时 , 即 

E=E, AND E, AND: AND 已 
时 ,车 已 知 CF(E1),CF(E:),…,CF(E,), 则 
CF(E)=min{ CF(E),CF(E,),*,CF(E,)} 
当 组 合 证 据 是 多 个 单一 证 据 的 析 取 时 , 即 
下 =E OR FE OR …OR E, 
时 , 若 已 知 CF(E1),CF(E;),…,CF(E,), 则 
CF(E)=max{ CFCE,),CFCE:),…,CFCE,)) 

另外 ,规定 CF( 了 -了 E)= 一 CF(E)。 

4) 不 确定 性 的 推理 算法 

C-F 模型 中 的 不 确定 性 推理 实际 上 是 从 不 确定 性 的 初始 证 据 出 发 ,不 断 运用 相关 的 
不 确定 性 知识 (规则 ) ,逐步 推出 最 终结 论 和 该 结论 的 可 信 度 的 过 程 。 每 一 次 运用 不 确定 
性 知识 ,都 需要 由 证 据 的 不 确定 性 和 规则 的 不 确定 性 计算 结论 的 不 确定 性 。 

中 证 据 肯 定 存在 (CF(E) 二 1) 时 ,有 

CF(H)=CF(H.,E) 

这 说 明 ,规则 强度 CF( 互 ,E) 实 际 上 就 是 在 前 提 条 件 对 应 的 证 据 为 真 时 结论 互 的 可 

言 度 。 
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@ 证 据 不 是 肯定 存在 (CF(E) 关 1) 时 ,其 计算 公式 如 下 。 
CF(H)=CF(H.E)X max{0,CF(E)} 

由 上 式 可 以 看 出 , 若 CF(CE) 过 0, 即 相应 证 据 以 某 种 程度 为 假 , 则 CF( 互 ) 王 0。 这 说 
明 在 该 模型 中 没有 考虑 证 据 为 假 时 对 结论 态 所 产生 的 影响 。 

@ 证 据 是 多 个 条 件 组 合 的 情况 。 

即 如 果 有 两 条 规则 推出 一 个 相同 结论 ,并 且 这 两 条 规则 的 前 提 相 互 独立 ,结论 的 可 信 
度 又 不 相同 , 则 可 用 不 确定 性 的 合成 算法 求 出 该 结论 的 综合 可 信和 度 。 

设 有 如 下 规则 : 

I EThen H (CF(H,E)) 
If EThen H (CF(H.,E,)) 

则 结论 互 的 综合 可 信 度 可 分 以 下 两 步 计算 。 

第 一 步 : 分 别 对 每 条 规则 求 出 其 CF(H), 即 

CF1(H) = CF(H,E) X max(0,CF(E,)) 
CF,(H) = CF(H,E;,) x max(0,CF(E,)) 
第 二 步 : 用 如 下 公式 求 EE 与 Es。 对 万 的 综合 可 信 度 。 
CF1(H)+CF,(H)—CF1(H)XCF,(H) 若 CFCH) 三 0 且 CF:(T) 志 0 
CF(CH)=4CF (CH) 十 CF:(H) 十 CFRCH)XCF:(CH) 若 CFICH)<0 且 CF:(H)<0 
CF1(H)+CF,(H) 车 CF1(H) 与 CFs( 昌 ) 异 号 

在 后 来 基于 MYCIN 基础 上 形成 的 EMYCIN 中 ,对 上 式 做 了 如 下 修改 : 

如 果 CF CE) 和 CF, (日 ) 异 号 , 则 


CF (H)+CF;,(H) 
1 一 min {|CF(H)|,|CF;(H)|} 





CF(H) 
其 他 情况 不 变 。 
如 果 可 由 多 条 知识 推出 同一 个 结论 ,并 且 这 些 规则 的 前 提 相 互 独立 ,结论 的 可 信 度 又 
不 相同 , 则 可 以 将 上 述 合成 过 程 推广 应 用 到 多 条 规则 支持 同一 条 结论 , 且 规 则 前 提 可 以 包 
含 多 个 证 据 的 情况 。 这 时 合成 过 程 是 先 把 第 一 条 与 第 二 条 合成 .然后 再 用 该 合成 后 的 结 
论 与 第 三 条 合成 ,依次 进行 下 去 ,直到 全 部 合成 完 为 止 。 
例 5.11 设 有 如 下 一 组 规则 : 
ri: If E, Then H (0.9) 
rs: If E, Then H (0.6) 
rs: If FE Then H (一 0.5) 
r: If E, AND (Es OR Es) Then E, (0.8) 
已 知 : CF(E;)=0.8,CF(E;)=0.6,CF(E,)=0.5,CF(E;s)=0.6,CF(E)=0. 8, 
求 CF(H)。 
解 : 应 用 得 : 
CF(E')= 0.8 X max{0,CF (E, AND (Es OR Es。))} 
= 0.8X max{0,min{CF (E,),CF (Es OR E,)}} 
一 0.8 X max{0,min{CF (E,),max{CF (E;:) ,CF (E。)}}} 
= 0.8 Xx max{0,min{0. 5,0. 8}} 
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一 0.8Xmax{(0,0.5} 
= 0.4 
应 用 得: 
CF1(H)= CF(H,E,) x max{0,CF (E,)} 
= 0.9X max{0,0.4} = 0.36 
应 用 得 : 
CF,(H)= CF (H,E;) x max{0,CF (E,)} 
一 0.6 X max{0,0.8} = 0.48 


CF3(H)= CF (H,E;:s) X max{0,CF (Es)} 
一 一 0.5 X max{0,0.6} =—0.3 
根据 结论 不 确定 性 的 合成 算法 ,得 : 
CFi,:( 百 ) 王 CF1(H)+CF;,(H)— CFI(H) x CF,(H) 
0.36 十 0.48 一 0.36 X0.48 
一 0.84 一 0.17 一 0.67 
CF (五 ) 十 CF;:( 万 ) 








人 
0.67 一 0.3 0.37 
1 一 min {0. 67,0.3} 0.7 
= 0.53 


这 就 是 求 出 的 综合 可 信和 度 , 即 CF(H) 二 0. 53。 
5.4.3 案例 : 帆船 分 类 专家 系统 


开发 一 个 帆船 分 类 智能 专家 系统 。 收 集 关 于 析 杆 结构 和 不 同类 型 帆船 的 设计 图 的 信 
息 ,每 种 类 型 的 帆船 可 以 由 其 设计 图 唯一 标识 。 图 5-3 所 示 给 出 了 8 种 类 型 的 帆船 信息 。 








Jib-headed Gaff-headed Staysail Gaff-headed 
Gutter Sloop Schooner Schooner 
1 -A 
Jib-headed Gaff-headed Jib-headed Geff-headed 
Yawl Yawl Ketch Ketch 


图 5-3 8 种 类 型 的 帆船 信息 
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图 5-4 显示 了 用 于 将 帆船 分 类 的 一 系列 规则 (leonardo 码 )。 系 统 在 与 用 户 对 话 阶 
段 获取 帆船 的 枪杆 数量 、 桥 杆 位 置 和 主 帆 结构 等 信息 ,然后 将 帆船 确定 为 图 5-3 中 的 
一 类 。 





帆船 分 类 专家 系统 :标记 1 
Rulel if "thenumber ofmasts' is one 
and 'the shape of the mainsail is triangular 
then boat is Jib-headed Gutter' 
Rule2 if ‘the number ofmasts' is one 
and "the shape of the mainsail' is quadrilateral 
then boat is 'Gaff-headed Sloop’ 
Rule3 if ‘the number ofmasts' is two 
and 'the main mast position' is ‘forward of the short mast' 
and 'the short mast position' is 'forward of the helm' 
and 'the shape of the mainsail is triangular 
then boat is Jib-headed Ketch 
Rule4 if "thenumber ofmasts'is two 
and 'the main mast position' is 'forward of the short mast' 
and 'the short mast position' is 'forward of the helm' 
and "the shape of the mainsail is quadrilateral 
then boat is"Gaff-headed Ketch' 
Rule5 if'the number of masts' is two 
and 'the main mast position' is 'forward of the short mast' 
and 'the short mast position' is 'aft the helm' 
and 'the shape of the mainsail' is triangular 
then boat is Jib-headed Yawl' 
Rule6 if “the number of masts' is two 
and 'the main mast position' is 'forward of the short mast' 
and 'the short mast position' is 'aft the helm' 
and 'the shape of the mainsail' is quadrilateral 
then boat is 'Gaff-headed Yawl' 
Rule7 if ‘the number of masts'is two 
and 'the main mast position' is 'aft the short mast' 
and ‘the shape of the mainsail' is quadrilateral 
then boat is 'Gaff-headed Schooner 
Rule8 if'the number of masts' is two 
and 'the main mast position' is 'aft the short mast' 
and 'the shape of the mainsail' is 'triangular with two foresails' 


then boat is 'Staysail Schooner 
/于 训 束 于 束 于 让 于 让 事 于 束 宙 束 束 于 于 刘 束 束 训 于 于 宁 末 于 认 宁 束 间 于 宙 束 玉 训 束 束 训 束 束 于 束 素 于 于 束 于 于 于 训 末 








必 SEEK 指令 创建 目标 ， 区 分 船只 
图 5-4 帆船 分 类 专家 系统 的 规则 


毫 无 疑问 ,在 天 空 湛蓝 和 海面 平静 的 情况 下 ,系统 可 以 帮助 我 们 识别 帆船 。 但 是 实 
际 情况 却 往往 不 是 如 此 ,在 大 风 或 者 大 雾 的 海面 ,看 清楚 主 帆 和 枪 杆 位 置 会 变 得 困难 ， 
甚至 不 可 能 。 尽 管 在 解决 真实 世界 的 分 类 问题 时 会 经 常 包 含 这 样 不 确定 和 不 完整 的 
数据 ,我 们 还 是 可 以 使 用 专家 系统 的 方法 ,前 提 是 需要 处 理 不 确定 性 。 可 以 应 用 确信 
因子 理论 解决 我 们 的 问题 。 确 信 因 子 理论 可 以 管理 增 量 获取 的 论据 和 不 同 信任 度 的 
信息 。 

图 5-5 显示 了 解决 帆船 分 类 问题 带 有 确信 因子 的 完整 规则 集 。 专 家 系统 需要 将 帆船 
分 类 , 即 

为 多 值 对 象 帆船 建立 确信 因子 。 要 应 用 确定 性 理论 ,专家 系统 会 提示 用 户 不 仅 要 输 
人 对 象 的 值 ,而 且 要 输入 对 象 值 的 确定 性 值 。 例 如 ,使 用 取 值 范围 为 0~1 的 Leonardo 
码 , 可 能 遇 到 如 下 对 话 ( 用 户 的 回答 用 箭头 表示 ,注意 确信 因子 在 不 同 规则 中 的 传递 ) 。 
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帆船 分 类 专家 系统 : 标记 2 
控制 cf 
Rule:1 if ‘thenumber of masts'is one 
then boat is Jib-headed Cutter * {cf 0.4}; 
boat is 'Gaff-headed Sloop’ {cf 0.4} 
Rule:2 if ‘the number of masts' is one 
and ‘the shape of the mainsail is triangular 
then boat is Jib-headed Cutter {cf 1.0} 
Rule:3 if "the number of masts' is one 


and ‘the shape of the mainsail is quadrilateral 


then boatis 'Gaff-headed Sloop’ {cf 1.0} 
Rule:4 if ‘the number of masts' is two 

then boat is 'Jib-headed Ketch' {cf 0.1}; 
boat is 'Gaff-headed Ketch' {cf 0.1}; 
boat is Jib-headed Yawl' {cf 0.1} ; 
boat is 'Gaff-headed Yawl' {cf 0.1}; 
boat is ‘Gaff-headed Schooner {cf 0.1} ; 
boatis ， Staysail Schooner {cf 0.1} 


Rule:5 if ‘the number of masts' is two 
and ‘the main mast position' is ‘forward of the short mast 


then boat is 'Jib-headed Ketch' {cf 0.2}; 
boat is 'Gaff-headed Ketch' {cf 0.2}; 
boat is Jib-headed Yawl {cf 0.2} 
boat is 'Gaff-headed Yawl' {cf 0.2} 


Rule:6 if ‘the number of masts' is two 
and ‘the main mast position' is 'aft the short mast 
then boat is 'Gaff-headed Schooner {cf 0.4}; 
boat is 'Staysail Schooner {cf 0.4} 
Rule:7 if ‘the number of masts' is two 
and ‘the short mast position' is forward of the helm' 
then boat is Jib-headed Ketch' {cf 0.4}; 
boat is 'Gaff-headed Ketch' {cf 0.4} 
Rule:8 if ‘thenumber of masts'is two 
and "he short mast position is "aft the helm'” 


then boatis Jib-headed Yawl' {cf 0.2} ; 
boat is 'Gaff-headed Yawl' {cf 0.2}; 
boat is 'Gaff-headed Schooner {cf 0.2}; 
boat is 'Staysail Schooner {cf 0.2} 


Rule:9 if ‘the number of masts' is two 
and ‘the shape of the mainsail is triangular 
then boat is Jib-headed Ketch' {cf 0.4}; 
boat is Jib-headed Yawl' {cf 0.4} 
Rule:10 if ‘the number of masts' is two 
and ‘the shape of the mainsail is quadrilateral 


then boat is 'Gaff-headed Ketch' {cf 0.3} ; 
boat is 'Gaff-headed Yawl' {cf 0.3}; 
boat is 'Gaff-headed Schooner {cf 0.3} 


Rule: 11 if ‘thenumber ofmasts'is two 
and ‘the shape of the mainsail is ‘triangular with two foresails' 


then boatis 'Staysail Schooner {cf 1.0} 
局 区 分 船 具 











图 5-5 帆船 分 类 专家 系统 中 的 不 确定 性 管理 
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What is the number of masts? 

只 two 

To what degree do you believe that the number of masts is two?Enter a numeric 
certainty between 0 and 1.0 inclusive- 


SD 0.9 

Rule:4 

3 "the number of masts' is two 

then boat is 'Jib-headed Ketch' {cE 0.1}; 
boat is 'Gaff- headed Ketch' tof 0:1}# 
boat is 'Jib- headed Yawl' {cf 0.1}; 
boat is 'Gaff- headed Yawl' {cf 0.1}; 
boat is 'Gaff- headed Schooner' {cf 0.1}; 
boat is 'Staysail Schooner' {cf 0.1} 


cf (boat is 'Jib- headed Ketch')=cf ("number of masts' is two) * 0.1=0.9 * 0.1=0.09 
cf (boat is 'Gaff- headed Ketch')=0.9 * 0.1=0.09 

cf (boat is 'Jib-headed Yawl')=0.9 * 0.1=0.09 

cf (boat is 'Gaff-headed Yawl')=0.9 * 0.1=0.09 

cf (boat is 'Gaff- headed Schooner')=0.9 * 0.1=0.09 

cf (boat is 'Staysail Schooner')=0.9 * 0.1=0.09 


boat is Jib- headed Ketch {cf 0.09} 
Gaff- headed Ketch {cf 0.09} 
Jib- headed Yawl {cf 0.09} 
Gaff- headed Yawl {cf 0.09} 
Gaff- headed Schooner {cf 0.09} 
Staysail Schooner {cf 0.09} 


What is the position of the main mast? 
只 aft the short mast 
To what degree do you believe that the main mast position is aft the short mast? 


Enter a numeric certainty between 0 and 1.0 inclusive. 


=>0.7 

Rule:6 

if 'the number of masts' is two 

and "the main mast position' is "aft the short mast' 

then boat is 'Gaff- headed Schooner' {cf 0.4}; 
boat is 'Staysail Schooner' {cf 0.4} 


Cfre:e (boat is 'Gaff- headed Schooner') =min [cf ('the number of masts' is two), 
cf ('the main mast position' is 'aft the short mast')) * 0.4 
=min [0.9, 0.7] * 0.4=0.28 
Cfrme:s (boat is 'Staysail Schooner')=min [0.9, 0.7] * 0.4=0.28 
cf (boat is 'Gaff- headed Schooner')=cfrwe:st Cfraue:s * (1- cfnwes) 
=0.09+0.28* (1-0.09)=0.34 
cf (boat is 'Staysail Schooner')=0.09+0.28 * (1-0.09) =0.34 
boat is Gaff- headed Schooner {cf 0.34} 
Staysail Schooner {cf 0.34} 
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Jib- headed Ketch {cf 0.09} 
Gaff- headed Ketch {cf 0.09} 
Jib- headed Yawl {cf 0.09} 
Gaff- headed Yawl {cf 0.09} 


What is the position of the short mast? 
=> forward of the helm 
To what degree do you believe that the short mast position is forward of the helm? 


Enter a numeric certainty between 0 and 1.0 inclusive. 


=>0.6 

Rule:7 

1f "the number of masts' is two 

and "the short mast position' is 'forward of the helm'" 
then boat is 'Jib- headed Ketch' {cf 0.4}; 


boat is 'Gaff- headed Ketch' {cf 0.4} 
Cfrwme:7 (boat is ' Jib- headed Ketch ') =min [cf('the number of masts' is two), 
cf ('the short mast position' is 'forward of the helm')] * 0.4 
=min[0.9,0.6] * 0.4=0.24 
Cfpme:1 (boat is 'Gaff- headed Ketch')=min [0.9, 0.6] * 0.4=0.24 
cf (boat is ' Jib-headed Ketch ')= cfpae:e+ cfkae: * (1- Cfrwe:e) 
=0.09+0.24* (1-0.09)=0.30 
cf (boat is 'Gaff- headed Ketch') =0.09+0.24# (1-0.09)=0.30 


boat is Gaff-headed Schooner {cf 0.34} 
Staysail Schooner {cf 0.34} 
Jib- headed Ketch {cf 0.30} 
Gaff- headed Ketch {cf 0.30} 
Jib- headed Yawl {cf 0.09} 
Gaff- headed Yawl {cf 0.09} 


What is the shape of the mainsail? 
=>triangular 
To what degree do you believe that the shape of the mainsail is triangular? 


numeric certainty between 0 and 1.0 inclusive. 


=>0.8 

Rule:9 

if "the number of masts' is two 

and "the shape of the mainsail' is triangular 
then boat is 'Jib- headed Ketch' {cf 0.4}7 


boat is 'Jib- headed Yawl， {cf 0.4} 
cfiwe:s (boat is ' Jib- headed Ketch ') 
=min [cf ('the number of masts' is two),cf('the shape of the mainsail' is triangular)] * 0.4 
=min [0.9, 0.8] * 0.4=0.32 
Cfiwe:s (boat is 'Jib-headed Yawl')=min [0.9, 0.8] * 0.4=0.32 
cf (boat is 'Jib-headed Ketch')=cfrwet+ cfrwe:s * (1- cfrwe7) 
=0.30+0.32 * (1-0.30)=0.52 
cf (boat is 'Jib- headed Yawl')==0.09+0.32 * (1-0.09)=0.38 
boat is Jib- headed Ketch {cf 0.52} 
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Jib- headed Yawl {cf 0.38} 
Gaff- headed Schooner {cf 0.34} 
Staysail Schooner {cf 0.34} 
Gaff- headed Ketch {cf 0.30} 
Gaff- headed Yawl {cf 0.09} 


现在 可 以 得 出 结论 ,帆船 应 该 属于 Jib-headed Ketch 类 型 ,几乎 不 太 可 能 是 Gaff- 
headed Ketch 类 型 或 者 Gaff-headed Yawl 类 型 。 


5.5 证 据 理论 


证 据 理 论 (theory of evidence) 也 称 为 D-S(Dempster-Shafer) 理 论 。 证 据 理 论 最 早 是 
基于 A. P. Dempster 所 做 的 工作 ,他 试图 用 一 个 概率 范围 ,而 不 是 单个 的 概率 值 去 模拟 不 
确定 性 ,G. Shafer 进一步 拓展 了 Dempster 的 工作 ,这 一 拓展 称 为 证 据 推理 (evidential 
reasoning) ,用 于 处 理 不 确定 性 、 不 精确 以 及 间或 不 准确 的 信息 。 证 据 理 论 将 概率 论 中 的 
单 点 赋值 扩展 为 集合 赋值 ,弱化 了 相应 的 公理 系统 ,满足 了 比 概率 更 弱 的 要 求 ,因此 可 被 
看 作 一 种 广义 概率 论 。 

在 证 据 理 论 中 引入 了 信任 函数 度量 不 确定 性 ,并 引用 似 然 函数 处 理由 于 “不 知道 ” 引 
起 的 不 确定 性 ,并 且 不 必 事 先 给 出 知识 的 先 验 概率 ,与 主观 Bayes 方法 相 比 ,具有 较 大 的 
灵活 性 。 因 此 ,证 据 理论 得 到 了 广泛 的 应 用 。 同 时 ,确定 性 因子 可 以 看 作 是 证 据 理 论 的 一 
个 特例 ,证 据 理 论 给 了 确定 性 因子 一 个 理论 性 的 基础 。 


5.5.1 假设 的 不 确定 性 


在 D-S 理论 中 ,可 以 分 别 用 信任 函数 、 似 然 函 数 及 类 概率 函数 描述 知识 的 精确 信任 
度 ,不 可 驭 斥 信任 度 及 估计 信任 度 , 即 可 从 各 个 不 同 角度 刻画 命题 的 不 确定 性 。 

D-S 理论 采用 集合 表示 命题 ,为 此 ,首先 应 该 建立 命题 与 集合 之 间 的 一 一 对 应 关系 ， 
把 命题 的 不 确定 性 问题 转化 为 集合 的 不 确定 性 问题 。 

设 0 为 变量 z 的 所 有 可 能 取 值 的 有 限 集合 (也 称 为 样本 空间 ), 且 Q 中 的 每 个 元 素 都 
相互 独立 , 则 由 Q 的 所 有 子 集 构 成 的 寡 集 记 为 2 。 当 Q 中 的 元 素 个 数 为 N 时 , 则 其 寡 集 
29 的 元 素 个 数 为 2 ,上 且 其 中 的 每 一 个 元 素 A 都 对 应 一 个 关于 z 的 命题 , 称 该 命题 为 *zx 
的 值 在 A 中 ”。 例 如 ,用 z 代表 看 到 的 颜色 ,Q={ 红 , 黄 , 蓝 ), 则 A={ 红 } 表 示 “> 是 红 
色 ”; 若 A=={ 红 , 蓝 ), 则 表示 “zxz 或 者 是 红色 ,或 者 是 蓝 色 ”。 


1. 概率 分 配 函 数 

定义 5.12 设 函 数 m: 2?->[0,1], 且 满足 
m($)=0 
DmA)=1 
Acn 


则 称 m 是 22 上 的 概率 分 配 函 数 ,m(A) 称 为 A 的 基本 概率 数 。 它 表示 依据 当前 的 环境 对 
假设 集 A 的 信任 程度 。 
对 于 上 面 给 出 的 有 限 集 Q 二 { 红 , 黄 , 蓝 ) , 若 定 义 22 上 的 一 个 基本 函数 mm: 
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m($,{ 红 },{ 黄 },{ 蓝 },{ 红 , 黄 },{ 红 , 蓝 ),{ 黄 , 蓝 },{ 红 , 黄 , 蓝 }) 
= {0;0.3,050, 1,0, 2;0, 2;0, 1;0. 1} 

其 中 ,{0,0.3,0,0.1,0.2,0.2,0.1,0.1} 分 别 是 老 集 22 中 各 个 子 集 的 基本 概率 数 。 显 然 ， 
m 满足 概率 分 配 函 数 的 定义 。 

对 概率 分 配 函 数 须 说 明 以 下 两 点 。 

(1) 概率 分 配 函 数 的 作用 是 把 Q 的 任意 一 个 子 集 都 映射 为 [0,1] 上 的 一 个 数 m(A)。 
当 ACQ 且 A 由 单个 元 素 组 成 时 ,m(A) 表 示 对 A 的 精确 信任 度 ; 当 ACQ、A 了 0Q, 且 A 
由 多 个 元 素 组 成 时 ,m(A) 也 表示 对 A 的 精确 信任 度 , 但 却 不 知道 这 部 分 信任 度 该 分 给 A 
中 的 哪些 元 素 ; 当 A=Q 时 , 则 m(A) 是 对 9 的 各 个 子 集 进行 信任 分 配 后 剩 下 的 部 分 , 它 
表示 不 知道 该 如 何 对 它 进行 分 配 。 

例如 : 当 A={ 红 } 时 ,由 于 m(A) 二 0.3, 它 表示 对 命题 “z 是 红色 ”的 精确 信任 度 为 0. 3。 

A 二 { 红 , 黄 ) 时 ,由 于 m(A) 二 0.2, 它 表示 对 命题 “zx 或 者 是 红色 ,或 者 是 黄色 ”的 精确 
信任 度 为 0. 2 , 却 不 知道 该 把 这 0. 2 分 给 { 红 } ,还 是 分 给 { 黄 }。 

A 二 0Q 二 { 红 , 黄 , 蓝 ) 时 ,由 于 m(A) 二 0.2, 表 示 不 知道 该 对 这 0. 2 如 何 分 配 , 但 它 不 
属于 { 红 ) ,就 一 定 属于 { 黄 } 或 { 蓝 ), 只 是 基于 现 有 的 知识 ,还 不 知道 该 如 何 分 配 而 已 。 

(2) m 是 29 上 而 非 Q 上 的 概率 分 布 ,所 以 基本 概率 分 配 函 数 不 是 概率 ,它们 不 必 相 
等 ,而 且 m(A) 关 1 一 m( 一 A)。 事 实 上 ,m({ 红 }) 十 m({ 黄 }) 十 m({ 蓝 ))= 二 0. 3 十 0 十 0. 1= 
0.4 天 1。 

2. 信任 函数 

定义 5.13 信任 函数 (Belief Function) 

Bel: 2°—[0,1] 
对 任意 的 ACSQ, 有 Bel(A) = 2》) m(B) 
BEA 


Bel(A) 表 示 当 前 环境 下 ,对 假设 集 A 的 信任 程度 ,其 值 为 A 的 所 有 子 集 的 基本 概率 之 和 ， 
表示 对 A 的 总 的 信任 度 。 

例如 ,Bel({ 红 , 黄 })==m({ 红 }) 十 m({ 黄 }) 十 m({ 红 , 黄 }) 二 0. 3 十 0 十 0. 2 二 0. 5。 

当 A 为 单一 元 素 组 成 的 集合 时 ,Bel(A) 二 m(A)。 如 果 命 题 “z 在 B 中 ”成 立 , 必 带 有 
命题 “zx 在 A 中 ”成 立 。Bel(A) 函 数 又 称 为 下 限 函 数 。 

3. 似 然 函数 

定义 5.14 似 然 函 数 (Plausibility Function) 

Pi: 2°—>[0,1] 

对 任意 的 ASQ, 有 P1(A)==1 一 Bel( 卫 A) 

其 中 , -A=Q 一 A。 

似 然 函 数 又 称 为 不 可 驳斥 函数 或 上 限 函数 。 由 于 Bel(A) 表 示 对 A 为 真 的 信任 度 ， 
Bel( 一 A) 表 示 对 一 A 的 信任 度 , 即 A 为 假 的 信任 度 ,因此 ,Pi(A) 表 示 对 A 为 非 假 的 信任 
度 。 下 面 仍 以 Q={ 红 , 黄 , 蓝 } 为 例 说 明 这 个 问题 。 

PI({ 红 )) 二 1 一 Bel( 了 { 红 )) 二 1 一 Bel({ 黄 , 蓝 )) 
三 1 一 (m({ 黄 )) 十 m({ 蓝 )) 十 m({ 黄 , 蓝 ))) 
一 1 一 (0 十 0.1 十 0.1) 一 0.8 
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这 里 ,0.8 是 “ 红 ” 为 非 假 的 信任 度 。 由 于 “ 红 ” 为 真 的 精确 信任 度 为 0. 3, 而 剩 下 的 
0. 8 一 0.3 二 0.5 则 是 知道 非 假 ,但 却 不 能 表 定 为 真 的 那 部 分 。 
另外 ,由 于 


>) mm(B) 


{NBS 
三 m({ 红 )) 十 m({ 红 , 黄 )) 十 m({ 红 , 蓝 )) 十 m({ 红 , 黄 , 蓝 }) 
一 0.3 十 0.2 十 0.2 十 0.1 王 0.8 


可 见 ,PI({ 红 }) = 二 2》) m(B) 


{ 红 )}N BA 
该 式 可 推广 为 
PI1(A) = >) m(B) 


ANBAS 

因此 ,命题 *z 在 A 中 ”的 似 然 性 ,由 与 命题 *z 在 B 中 ”有 关 的 mn 值 确定 ,其 中 命题 “zx 
在 B 中 ”并 不 会 使 得 命题 “zx 不 在 A 中 ”成 立 。 所 以 ,一 个 事件 的 似 然 性 是 建立 在 对 其 相 
反 事件 不 信任 的 基础 上 的 。 

信任 函数 和 似 然 函数 有 如 下 性 质 。 

(1) Bel($)=0,Bel(Q)=1,PL1($)=0,PL(Q)=1,。 

(2) 如 果 ASB,Bel(A) 志 Bel(B) ,Pi(A) 志 PL(B)。 

(3) VAEQ, PL(A)>Bel(A)., 

(4) VY AEQN,Bel(A)+Bel( -A)<1,PI(A)+PL( -A)>1。 

由 于 Bel(A) 和 PL(A) 分 别 表示 A 为 真 的 信任 度 和 A 为 非 假 的 信任 度 ,因此 ,可 分 别 
称 Bel(A) 和 PL(A) 为 对 A 信任 程度 的 下 限 和 上 限 , 记 为 A(Bel(A), P1(A))。 

PL(A) 一 Bel(A) 表 示 既 不 信任 A, 也 不 信任 一 A 的 程度 , 即 对 于 A 是 真是 假 不 知道 
的 程度 。 

例如 ,在 前 面 的 例子 中 曾 求 过 Bel({ 红 }) 二 0.3, PL({ 红 )) 二 0. 8, 因 此 有 { 红 }) (0. 3， 
0.8)。 它 表示 对 { 红 } 的 精确 信任 度 为 0.3, 不 可 驳斥 部 分 为 0.8, 肯 定 不 是 { 红 } 的 为 0.2。 

举 一 个 更 现实 的 例子 。 假 定 我 对 朋友 赵 波 的 可 信赖 程度 有 一 个 主观 的 概率 。 他 是 可 
信赖 的 可 能 性 为 0. 9 ,不 可 信赖 的 可 能 性 为 0.1。 假 设 赵 波 告诉 我 ,我 的 计算 机 被 别人 侵 
入 了 。 如 果 赵 波 是 可 信赖 的 , 则 这 是 真 的 ,但 如 果 他 是 不 可 信赖 的 ,这 句 话 则 不 一 定 为 假 。 
所 以 , 赵 波 一 个 人 的 陈述 证 实 我 的 计算 机 被 侵入 的 可 信 度 为 0.9, 没 有 被 侵入 的 可 信 度 为 
0.0。0.0 的 可 信 度 与 0. 0 的 概率 不 同 , 它 并 不 意味 着 我 确信 计算 机 没有 被 侵入 ,而 只 是 
表明 赵 波 的 陈述 没有 给 我 理由 相信 计算 机 没 被 侵入 。 在 这 种 情况 下 , 似 真 性 Pl 为 

了 LCcomputer_broken_into) 王 1 一 Bel(not(Ccomputer_broken_into) ) 一 1 一 0.0 
我 对 赵 波 的 可 信和 度 为 [0. 9,1.0]。 需 要 指出 的 是 ,仍然 没有 证 据 表 明 我 的 计算 机 没 被 
侵入 。 

4. 假设 集 4 的 类 概率 函数 / (4) 

IA| 


f(A)=Bel(A)+1gT PA) Bel(A)) 


其 中 ,1A|、191 分 别 表示 A 和 Q 中 包含 元 素 的 个 数 。 类 概率 函数 (A) 也 可 用 来 度 
量 证 据 A 的 不 确定 性 。 
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5.5.2 证 据 的 不 确定 性 与 证 据 组 合 


证 据 羽 的 不 确定 性 可 以 用 类 概率 函数 FE) 表 示 , 原 始 证 据 的 FCE) 应 由 用 户 给 定 ， 
作为 中 间 结 果 的 证 据 可 以 由 下 面 的 不 确定 性 传递 算法 确定 。 

在 实际 问题 中 ,对 于 相同 的 证 据 ,由 于 来 源 不 同 ,可 能 会 得 到 不 同 的 概率 分 配 函 数 。 
例如 ,考虑 9 二 { 红 , 黄 ) ,假设 从 不 同 知识 源 得 到 的 概率 分 配 函 数 分 别 为 

mi($,{ 红 },{ 黄 ),{ 红 , 黄 )) 二 (0,0.4,0.5,0.1) 

mz($,，{ 红 },{ 黄 },{ 红 , 黄 }) 二 (0,0.6,0.2,0.2) 
在 这 种 情况 下 ,需要 对 它们 进行 组 合 。 

定义 5.15 设 m 和 wm 是 两 个 不 同 的 概率 分 配 函 数 , 则 其 正 交 和 闷 一 za 中 ms 满足 


m($)=0 
m(A) = K™! x D3 mi(x) X m2(y) 
zy=A 
其 中 , K = 1 一 > mi(x) Xmz(y) = > mi(x) X m2(y) 
zNy=$ zy 天 


如 果 开 天 0, 则 正 交 和 闵 也 是 一 个 概率 分 配 函 数 ;如 果 天 一 0, 则 不 存在 正 交 和 m, 称 
mi 与 ms 矛盾 。 

例 5.12 设 Q={a,b), 且 从 不 同 知识 源 得 到 的 概率 分 配 函 数 分 别 为 

ml(g,la},{b}, (la,b})=(0,0.3,0.5,0.2) 

m2($,{a},{b}, {lab})=(0,0.6,0.3,0.1) 
求 正 交 和 m= 二 mi 中 mo。 

解 : 先 求 

K=1— yD mi(zx) X m2(y) 


Ny=$ 
= 1— (ma({(a}) Xm ({6))) + mt{b)) Xm ({a}) 
一 1 一 (0.3X0.3 十 0.5X0.6) = 0.61 
再 求 mg,{a},{o} ,fa,5b)), 由 于 
1 


m({a})= G61 x 本 天 nm (zx) X my) 


= TX Cm {a)) xX ma +m a)) Xma({asbd))) 十 
m({a.b}) Xm,({a}) 


= 1(0.3X0.6+0.3X0.1+0.2X0.6) = 0.54 


同 理 可 得 : 
m({6}) = 0.43, m({a,b}) = 0.03 
故 有 
m($,{a},{b},{a.b}) 一 (0.0.54,0.43,0.03) 。 
对 于 多 个 概率 分 配 函 数 , 如 果 它 们 是 可 以 组 合 的 , 则 也 可 以 通过 正 交 和 运算 将 它们 组 
合成 一 个 概率 分 配 函 数 ,其 组 合 方法 可 定义 如 下 。 
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定义 5.16 设 加 ,ma ,…，zms 是 7 个 概率 分 配 函 数 , 则 其 正 交 和 六 一 和 四 略 申 … 四 
mm 为 
m($)=0 
mA)= KxX > [mcA) 


NA;=A 1<i<n 


其 中 ,K = » I mi(A;) 


NAAS$ 1<i<n 


5.5.3 规则 的 不 确定 性 


具有 不 确定 性 的 推理 规则 可 表示 为 
If E Then H,CF 
其 中 ,五 为 假设 ,E 为 支持 互 成 立 的 假设 集 ,它们 是 命题 的 逻辑 组 合 。CF 为 可 信 度 
因子 。 
五 可 表示 为 : 阳 ={ar as …， an) auEgQ(i 一 1,2,…,mm) ,HH 为 假设 集合 Q 的 子 集 。 
CF 二 {a ,co，…， cm) ,ct 用 来 描述 前 提 下 成 立时 a; 的 可 信和 度 。CF 应 满足 如 下 条 件 : 
(1) c;20,1<i<m。 


yi 
i=l] 


5.5.4 不 确定 性 的 传递 与 组 合 


1. 不 确定 性 的 传递 


对 于 不 确定 性 规则 : 
If E Then H.CF 
定义 : 
Mi({ai)) 王 JE)。c (一 1,2 2) 
或 表示 为 
mi({ai}j {as} ses {am)) = Cf(E) ca, f(E) 。cs…，FCE) cm) 
规定 : 


ma(Q) 一 ] 一 区 m({ai}) 


而 对 于 9 的 所 有 其 他 子 集 甩 , 均 有 mH) 二 0。 
当 互 为 @ 的 真子 集 时 ,有 
Bel(H) = >) m(B) = 了 m({ai}) 


BE 有 i=1 
进一步 可 以 计算 PLCH) 和 f(H)。 
2. 不 确定 性 的 组 合 
当 规 则 的 前 提 ( 证 据 )E 是 多 个 命题 的 合 取 或 析 取 时 ,定义 : 
CE A Ez 入 … NE,)= min(f (ED),f(E),*,f(E,)) 
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CE V E: V :VE,)= max(f(E),f(E:),…,f(E,)) 
当 有 多 条 规则 支持 同一 结论 时 ,如 果 A 二 {a ,as,… ,a,), 则 
I E, Then H,CF: (CF! = {caycaz，…can)) 
I E Then H,CF,; (CF; = {cziyczz cos)) 


I E, Then H,CF, (CF, = {cm Crs" Cm)}) 
如 果 这 些 规则 相互 独立 地 支持 结论 互 的 成 立 , 可 以 先 计算 
mi({ar} (az wy{as)) 一 (FE)。ca，F(Ei)。cz，F(E)。cm)G 一 1,2， 2) 
然后 根据 前 面 介 绍 的 求 正 交 和 的 方法 ,对 这 些 m; 求 正 交 和 ,以 组 合 所 有 规则 对 结论 玉 的 
支持 。 一 旦 累加 的 正 交 和 zz( 瑟 ) 计 算出 来 ,就 可 以 计算 Bel(H)、PL(H)、f(H)。 


5.5.5 证 据 理论 案例 


有 如 下 推理 规则 : 

rm: If FEIVCE:AE:) ThenAl={an,awaws} CF={0.2,0.3,0.4} 

ra: If E,AM(EsVE) Then A,={an} CF,={0.7} 

rs:If A, Then A={ai,as} CF;={0.4,0.5} 

rn:lf A, Then A={ai,as} CF,={0.4,0.4} 

这 些 规则 形成 如 图 5-6 所 示 的 推理 网 络 。 原 始 数 据 的 概率 在 系统 中 已 经 给 出 : 
f(E)=0.5, f(E,)=0.7, f(Es,)=0.9, f(E,)=0.9, f(E:s)=0.8, f(Es)=0.7 

假设 19|1 二 10, 现 在 需要 求 出 A 的 确定 性 。 


4 


SE 










































































Al 4 
li Lali 
[Ls | | £ | 
图 5-6 ”推理 网 络 


解 : 第 一 步 , 求 A, 的 确定 性 。 
(CE V (E: M Es)) = max {0.5,min {0.7,0.9}} = 0.7 
m({an},{aw},{aws}) = (0.7X0.2,0.7X0.3,0.7X0.4) = (0.14,0.21,0.28) 
Bel(A1) =m({an))+m({aw})t+m({as}) = 0.14++0.21++0.28 = 0.63 
PI(A) 三 1 一 Bel(” AD) 三 1 一 0 三 1 
f(A1)= Bel(A) 十 (|A 79)XCPCAD 一 Bel(AD)) 
一 0.63 十 3/10X(1 一 0.63) 一 0.74 
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第 二 步 , 求 A, 的确 定性。 
CEA (Es V Es)) = min {0.9,max {0.8,0.7}} = 0.8 
ma({az}) = 0.8 XxX0.7= 0.56 
Bel(A:) = m;({an}) = 0.56 
Pi(A,) 1 一 Bel(”A:) i=0 二 1 
f(A;)= Bel(A,)+ (| A; | /| 01)x (Pi(A,)— Bel(A,)) 
0.56 十 1/10X(1 一 0.56) 0. 60 
第 三 步 , 求 A 的 确定 性 。 
根据 7s 和 4, 有 : 
ms({ai},{azs}) = (0.74X 0.4,0.74 XxX 0.5) = (0. 30,0.37) 
m({a},{azs}) = (0.6 XxX 0.4,0.6 x 0.4) = (0.24,0.24) 
ms(0) 一 1 一 (os({ai)) 十 ms((az))) 一 1 一 (0.30 十 0.37) = 0.33 
mi(0Q) =1— (maa})i+m {as})) 一 1 一 (0.24 十 0.24) = 0.52 
由 正 交 和 公式 得 到 : 
天 一 ma(z) Xm(y) 


zy 
= mia(Q) m+m Qnma {a)) tm na)) tm a}) mm (Q) 
+ms({a}) oe na({a}) + ms {as}) om (0) ms (as}) » m({as}) 
二 0.33X0.52 十 0.33X0.24 十 0.33X0.24 十 0.3X0.52 十 0.3X0.24 
二 0.37X0.52 十 0.37X0.24 
= 0. 84 
则 有 : 
m({a})= Ko Gm3(0) ema}) + ma {fa}) em (OQ) +m {a}) mm ({a1})) 
一 1/0.84X(0.33X0.24 十 0.30X0.52 十 0.30X0.24) = 0.37 
m({as})= Ke (ms (0) om as) ma({as}) oe na (0) mas}) » ma {as})) 
一 1/0.84X(0.33X0.24 十 0.37X0.52 十 0.37X0.24) = 0.41 









































于 是 : 
Bel(A) = m({a1))+m({as}) 一 0.37 十 0.41 = 0.78 
PI(A)=1—Bel(~"A)=1—0=1 
f(A)= Bel(A)+(| A1/|Q1)X (P(A)— Bel(A)) 
一 0.78 十 2/10X (1 一 0.78) = 0.82 
证 据 理论 的 优点 在 于 能 够 满足 比 概率 论 更 弱 的 公理 系统 ,可 以 区 分 不 知道 和 不 确定 
的 情况 ,可 以 依赖 证 据 的 积累 ,不 断 缩 小 假设 的 集合 。 
但 是 ,在 证 据 理论 中 ,证据 的 独立 性 不 易 得 到 保证 ;基本 概率 分 配 函 数 要 求 给 的 值 太 
多 ,计算 传递 关系 复杂 , 随 着 诊断 问题 可 能 答案 的 增加 ,证 据 理论 的 计算 呈 指 数 增长 ,传递 
关系 复杂 ,比较 难以 实现 。 
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5.6 模糊 逻辑 和 模糊 推理 


不 确定 性 的 产生 有 多 种 原因 ,如 随机 性 、 模 糊 性 等 。 处 理 随机 性 的 理论 基础 是 概率 
论 ,处 理 模糊 性 的 基础 是 模糊 集合 论 。 模 糊 集 合 论 是 1965 年 由 Zadeh 提出 的 ,随后 ,他 
又 将 模糊 集合 论 应 用 于 近似 推理 方面 ,形成 了 可 能 性 理论 。 近 似 推 理 的 基础 是 模糊 退 
辑 (fuzzy logic) , 它 建 立 在 模糊 理论 的 基础 上 ,是 一 种 处 理 不 精确 描述 的 软 计 算 , 它 的 应 
用 背景 是 自然 语言 理解 。 模 糊 逻辑 和 可 能 性 理论 已 经 广泛 应 用 于 专家 系统 和 智能 控 
制 中 。 


5.6.1 模糊 集合 及 其 运算 


在 经 典 集合 论 中 ,一 个 元 素 x 是 否 属于 某 一 个 集合 A 是 明确 的 ,要 么 工 属于 A ,要 么 
工 不 属于 A 。 它 的 逻辑 基础 是 二 值 逮 辑 , 即 通过 一 个 特征 函数 C(z) 描 述 元 素 与 集合 的 隶 
属 关系 : 


0 ZE&A 
在 现实 世界 中 ,事物 通常 不 是 非 此 即 彼 的 。 例 如 ,年 龄 可 以 分 为 “老年 “中 年 “ 青 
年 ”, 但 并 找 不 到 一 个 年 龄 数值 作为 青年 和 中 年 的 分 界线 。 
为 表示 类 似 这 样 的 一 些 模糊 概念 ,Zadeh 于 1965 年 提出 模糊 集合 理论 ,其 基本 思想 
就 是 把 传统 集合 论 中 由 特征 函数 决定 的 绝对 隶属 关系 模糊 化 ,把 集合 {0,1) 扩 散 到 区 间 
[0,1, 使 元 素 x 对 子 集 A 的 隶属 程度 不 再 局 限于 取 0 或 1, 而 是 可 以 取 集 合 [0,1] 上 的 任 
何 值 ,以 表示 元 素 xz 隶属 于 子 集 A 的 模糊 程度 。 
定义 5.17 设 z 为 论 域 U 中 的 元 素 ,A 为 U 上 的 逻辑 子 集 。 定 义 
pA:U— [0,1] 
A= {pyar)/r,r EU} 
则 称 ya (xz) 为 A 的 隶属 函数 ,ya (zx)EL0,1] ,pa (xi) 称 为 x; 对 A 的 隶属 度 。 
当 UU 为 有 穷 集合 {x1 ,zs，… ,Zz,} 时 ,有 


th = DY pn 
i U 为 可 数 无 穷 集合 {zi ,zs,…) 时 .有 

i 
当 LU 为 不 可 数 集合 时 ,有 国 

U = {pated /a 


U 
一 个 由 单个 成 员 构 成 的 模糊 集合 称 为 单 点 集 (singleton) 。 单 点 集 所 处 的 点 称 为 支撑 
点 (support point) ,或 单 点 集 的 支撑 值 (support value) 。 一 个 单 点 集 的 隶属 函数 ,在 支撑 
点 以 外 的 变量 空间 中 的 任何 地 方 均 取 值 为 0, 在 支撑 点 ,隶属 度 为 1。 
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显然 ,经 典 集合 是 模糊 集合 的 特例 ,模糊 集合 是 经 典 集合 的 扩展 。 一 个 模糊 集 A 是 
以 隶属 函数 ja(z) 描 述 的 , 当 pa(z) 二 1 时 ,z 确定 性 隶属 于 A; 而 ya(z) 二 0 时 ,xz 确定 性 
不 隶属 于 A ;pa (zx) 取 其 他 值 时 ,隶属 程度 模糊 。 隶属 程度 的 概念 构成 模糊 集 理论 的 
基石 。 

下 面 以 人 的 年 龄 作为 论 域 考察 模糊 集 。 假 定 对 于 "年龄", 可 以 有 3 个 值 。 

年 龄 一 { 青 ,中 , 老 } 

我 们 可 以 为 “年 龄 "的 3 个 定性 值 分 别 建立 隶属 函数 pr yw 和 po。 如 图 5-7 所 示 , 它 
们 各 以 梯形 或 三 角形 表示 。 从 图 中 可 见 ,这 3 个 隶属 函数 是 相互 重 又 的 , 即 年 龄 在 30 一 
65 岁 的 人 不 能 确定 性 地 划 归 某 一 个 子 集 。 上 述 用 梯形 或 三 角形 表示 的 pr .wu 和 wo 的 隶 
属 函 数 虽然 简单 ,但 是 因 其 数学 表达 和 运算 简便 ,所 占 内 存 空 间 小 ,并 且 在 许多 场合 下 与 
采用 其 他 复杂 形状 或 复杂 数学 公式 表示 的 隶属 函数 相 比 ,在 实现 模糊 推理 和 控制 方面 并 
无 大 的 差别 ,所 以 已 被 广泛 采用 。 当 然 , 也 可 以 根据 应 用 领域 的 特点 和 要 求 ,设计 各 种 更 
为 精确 的 隶属 函数 。 








nh 
1 站 M 0 
1 1 
1 
1 | 
> <> < | 
0 30 50 65 年 龄 ” 


图 5-7 隶属 函数 示例 


与 普通 集合 一 样 , 对 模糊 集 可 以 进行 各 种 迎 辑 运算 ,主要 的 运算 有 并 、 交 、 补 等 。 设 A 
和 8B 均 为 论 域 U 上 的 模糊 集 , 则 对 于 元 素 xz, A 与 B 的 并 、 交 、 补 运算 定义 如 下 。 
HAUB(T) = max[pa (zx) ,pa (zx)] 
Apana(z) = min[pa (zx) ,pa (x)] 
A(T) = 1—pa(z) 
可 见 , 模 糊 集合 的 逻辑 运算 实质 上 就 是 隶属 函数 的 组 合 运算 过 程 。 


5.6.2 模糊 关系 


定义 5.18 设 U,U: ,…,U, 是 个 论 域 .A; 是 UiGi=1,2,…,z) 上 的 模糊 集 , 则 称 : 
Ai XA:X…XA。 一 | (pa Cz) MN pa x) 人 … A pm CT) /Ti Ta T)) 
为 Al ,A:,…,A, 的 笛 卡 儿 乘 积 , 它 是 UXUX… XU 上 的 一 个 模糊 集 。 
定义 5.19 Ui XU X…XU,, 上 nn 元 模糊 关系 R 是 以 UlXU,X…XU, 为 论 域 的 模 
糊 集 合 ,R 可 以 记 为 
R= | LR(TX19°" Ta) /X10 Ta) 


UL XUs XxU, 


在 上 述 定义 中 ,mu (zi) (i 二 1,2,…,n) 是 模糊 集 A 的 隶属 函数 ;yr (zi ,zs，,…,z,) 是 


吉 5 竟 不 殉 定 知识 表示 和 和 准 理 一 221 


模糊 关系 R 的 隶属 函数 , 它 把 Di XU X… XU 上 的 每 一 个 元 素 (zi ,zs，…,z,) 映 射 为 
[0,1] 上 的 一 个 实数 ,该 实数 反映 出 zi ,xs,…,z, 具有 关系 及 的 程度 ,特别 是 对 于 二 元 关 
R= | prR (Ty)/ (rx,y) 

UV 
perzyy) 反 映 了 工 和 >y 具有 关系 R 的 程度 。 
模糊 关系 是 经 典 集合 论 中 关系 的 推广 。 一 个 有 限 论 域 上 的 二 元 模糊 关系 可 以 表示 成 
隶属 度 和 矩阵 的 形式 。 假 设 
U = {ris729°" Tm} 
了 三 (ye 
则 UXV 上 的 二 元 模糊 关系 为 
AR(CzlyyI) HRCzyy) … ARGCzyyn) 
赤 三 Pe yy1) Heros) 园 叶 paar 
HR (Tm 1) HR(Zmyy2) … ARCZznyyn) 
对 于 模糊 关系 ,同样 可 以 像 经 典 集合 论 那 样 定义 它 的 包含 、 相 等 、 交 、 并 、 补 等 关系 和 
操作 ,这 些 概念 与 一 般 模 糊 集 的 概念 相同 。 下 面 定义 模糊 关系 的 合成 操作 。 
定义 5.20 设 R 和 R; 分别 为 UXV 与 VXxW 上 的 两 个 模糊 关系 , 则 R, 和 RR 的 合 
成 是 指 从 U 到 W 的 一 个 模糊 关系 , 记 为 


Ri° R, = | max min(jypi (ZT»y) pre (V2))/ (rx,2) 
UxW,y€V 
0.10.2 0.3 0.2 
0 , 设 A 二 ， B= , 则 有 
on, 设 A=| 036.1] sa-[o ie7j 


二 0.90.8] = 0.7 0.8 
0.70:9 0.9 0.3 
0.3 0.2 0.1 0.2 
AUB= ,:ANB= 
y | 四 | R [ea 


5.6.3 语言 变量 


模糊 集合 的 一 种 应 用 是 计算 语言 学 (computational linguistic) ,目的 是 对 自然 语言 的 
语句 进行 计算 ,就 像 对 逻辑 语句 进行 运算 一 样 。 为 了 对 自然 语言 语句 进行 描述 和 研究 ,和 
谓词 逻辑 一 样 ,人 们 引进 了 语言 变量 的 概念 。 语 言 变量 可 以 看 作 是 用 某 种 自然 语言 和 人 
工 语言 的 词语 或 句子 表示 变量 的 值 和 描述 变量 间 的 内 在 联系 的 一 种 系统 化 的 方法 , 它 为 
近似 推理 中 变量 值 的 表示 和 模糊 命题 的 真 值 . 概 率 值 和 可 能 值 的 表示 提供 了 一 个 基本 的 
方法 。 

模糊 集合 和 语言 变量 可 用 于 量化 自然 语言 的 含义 ,因而 可 用 来 处 理 具 有 指定 值 的 语 
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言 变量 。 语 言 变量 取 值 范围 是 一 个 项 目 集 , 该 集合 中 的 元 素 一 般 可 以 分 为 基本 语言 项 和 
含 修饰 词 的 语言 项 。 例 如 ,语言 变量 “年龄 ”", 其 中 “年 轻 “ 年 老 ” 等 是 基本 语言 项 ,“ 非 常 ” 
“不 很 “不 ”等 是 修饰 词 。 

语言 变量 常常 可 用 于 启发 式 规则 中 ,如 ， 

如 果 电 视 太 暗 , 则 可 以 调 亮 一 些 。 

如 果 太 热 , 那 么 可 以 把 空调 打开 。 

这 些 语 言 变量 可 能 是 隐 含 在 规则 中 的 。 另 外 , 某 些 语言 变量 可 以 是 二 阶 模糊 集合 。 
例如 ,对 于 图 像 质量 ,其 取 值 可 以 包括 : 

颜色 、 色 度 、 亮 度 . 唆 声 浓度 
这 里 每 一 个 值 都 可 以 是 一 个 语言 变量 ,上 且 其 值 又 是 一 个 模糊 集合 。 因 此 ,可 以 为 语言 变量 
安排 一 个 层次 , 它 对 应 于 模糊 集合 的 阶 , 最 终 直 到 一 阶 模糊 集合 。 


5.6.4 模糊 逻辑 和 模糊 推理 


模糊 逻辑 是 模糊 专家 系统 的 基础 ,可 用 来 处 理 不 确定 性 ,以 及 模拟 常识 推理 。 为 了 克 
服 二 值 迪 辑 的 不 足 , 人 们 提出 了 许多 不 同 的 多 值 迎 辑 系 统 , 如 基于 true、 false、unknown 
的 三 值 逻辑 系统 。 

模糊 逻辑 可 以 看 作 是 多 值 逮 辑 的 扩展 。 但 是 ,模糊 逻辑 的 目的 和 应 用 不 同 ,模糊 好 辑 
是 面向 事物 特性 和 能 力 的 不 精确 描述 , 它 是 一 种 近似 推理 ,而 不 是 精确 推理 。 本 质 上 , 近 
似 或 模糊 推理 是 在 一 组 可 能 不 精确 的 前 提 下 推出 一 个 可 能 不 精确 的 结论 。 

模糊 逻辑 的 基本 思想 是 将 常规 数值 变量 模糊 化 ,使 变量 成 为 以 定性 术语 (也 称 语言 
值 ) 为 值 域 的 语言 变量 。 模 糊 逻 辑 的 核心 概念 是 语言 变量 , 当 用 语言 变量 描述 对 象 时 ,这 
些 定性 术语 就 构成 模糊 命题 。 如 果 省 上 略 被 描述 的 对 象 , 则 模糊 命题 可 表示 为 “(语言 变量 ) 
(定性 值 )" 形 式 。 例 如 ,“ 张 三 年 轻 ” 就 是 一 个 模糊 命题 ,其 模糊 程度 用 定性 术语 “年 轻 ” 的 
隶属 函数 表示 。 

可 以 对 模糊 命题 作 合 取 、 析 取 、 取 反 等 迎 辑 操作 。 每 个 模糊 命题 均 由 相应 的 一 个 模糊 
集 做 细 化 描述 ,所 以 模糊 逻辑 运算 与 模糊 集运 算是 一 致 的 。 模 糊 迟 辑 运 算 符 可 以 定义 
如 下 。 


Z(nA) 一 ZINOT A) 一 1 一 pa(CZz) 

z(A) V z(B) = zx(A OR B) = max(ya(z), ys (x)) 

Xx(A) A zx(B) = zx(A ANDB) = min(ya (x), pa (x)) 

Z(A) 一 Z(B) = 7x(A—B) = 7x((7A)V B)= max(l — pa(x),ps (zx)) 


例如 , 设 模 糊 集 合 TRUE 可 以 定义 为 
TRUE = 0. 1/0.1 十 0.3/0.5 十 1/0.8 
根据 上 面 关 于 模糊 运算 符 的 定义 ,有 
FALSE= 1 一 TRUE 
= (1 一 0.1)/0.1 十 (1 一 0.3)/0.5 十 (1 一 1)/0.8 
一 0.9/0.1 十 0.7/0.5 
人 脑 善于 根据 不 精确 和 不 完整 的 信息 进行 决策 。 人 们 在 处 理 日 常生 活 中 许多 实际 问 
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题 时 采用 简单 .直观 .自然 的 描述 方法 ,这 些 描述 可 能 看 起 来 是 含糊 的 。 例 如 ,下 面 是 一 个 
空气 调节 器 的 控制 策略 。 

If the temperature is hot,turn the AC fan on high. 

If the temperature is warm,turn the AC fan on medium. 

If the temperature is comfortable,turn the AC fan off. 

然而 ,这 种 方法 不 容易 在 计算 机 的 严格 逻辑 的 范畴 中 实现 。 利 用 模糊 逻辑 ,就 能 够 用 
计算 机 可 以 理解 的 术语 解释 语义 的 不 精确 。 模 糊 逻 辑 为 模糊 规则 提供 了 一 个 系统 的 
解释 。 

模糊 推理 有 多 种 模式 ,其 中 最 重要 的 且 广 泛 应 用 的 是 基于 模糊 规则 的 推理 。 模 糊 规 
则 的 前 提 是 模糊 命题 的 逻辑 组 合 ( 经 由 合 取 、` 析 取 和 取 反 操作 ) 作 为 推理 的 条 件 ; 结 论 是 表 
示 推 理 结果 的 模糊 命题 。 所 有 模糊 命题 成 立 的 精确 程度 (或 模糊 程度 ) 均 以 相应 语言 变量 
定性 值 的 隶属 函数 表示 。 

一 个 模糊 推理 规则 是 一 条 表示 变量 间 依 赖 关系 的 语句 ,具有 如 下 格式 。 

If <condition> Then <=consequence> 

这 些 语言 控制 规则 由 模糊 关系 解释 ,并 且 每 个 规则 说 明了 不 确定 输入 值 和 不 确定 输 
出 值 之 间 的 关系 。 

一 个 规则 可 以 进一步 分 解 。 志 condition 之 可 由 若干 个 前 件 (antecedent) 组 成 。 当 考 
虑 两 个 输入 变量 ,一 个 输出 变量 的 控制 器 时 ,规则 的 形式 可 如 下 表示 。 

If X is positive large and Y is positive small,then C is positive medium. 

术语 “positive large”“positive medium” 和 “positive small” 被 表示 为 模糊 集合 ,并 且 是 
输入 变量 和 YY、 输出 变量 C 的 确定 值 的 不 精确 描述 。 

类 似 地 ,二 consequence 二 实际 上 也 可 由 若干 个 后 件 组 成 。 

一 个 基于 模糊 规则 的 系统 被 认为 是 一 种 变换 机 制 ,这 种 机 制 在 它 的 输出 点 生成 信号 ， 
以 相应 于 它 的 输入 结 点 获得 的 信号 。 这 样 一 个 系统 称 为 模糊 推理 单元 ,或 简称 推理 单元 。 
更 精确 地 ,一 个 推理 单元 由 一 组 输入 变量 .一 组 输出 变量 和 一 个 执行 一 组 推理 规则 的 机 制 
组 成 。 

假设 我 们 正在 试图 建立 一 个 基于 前 述 空调 控制 策略 的 空调 风扇 控制 器 ,将 需要 一 个 
温度 传感器 和 一 个 设置 期 望 温度 的 机 制 。 除 此 之 外 ,还 需要 一 个 设备 计算 实际 的 温度 与 
期 望 的 温度 的 差 值 (代数 的 )。 这 个 差 称 为 temperature_error, 它 可 作为 控制 器 的 输入 。 
控制 器 的 输出 变量 是 风扇 的 速度 ,由 fan_speed 表示 。 

下 面 通过 一 个 模糊 系统 开发 环境 介绍 模糊 推理 过 程 。 这 是 一 个 模糊 智能 开发 环境 ， 
该 系统 实现 了 多 级 模糊 推理 及 模糊 控制 与 经 典 PID 混合 控制 机 制 ,是 一 个 支持 复杂 控制 
系统 设计 仿真、 实时 控制 调试 的 一 体 化 环境 。 

模糊 推理 过 程 是 由 给 定 的 输入 值 根据 模糊 规则 产生 清晰 的 ( 非 模糊 的 ?输出 值 的 内 部 
过 程 。 在 设计 模糊 控制 器 时 ,必须 找 出 主要 的 控制 参数 ,并 给 出 一 个 术语 的 集合 ,该 集合 
可 以 满足 对 每 个 语言 变量 的 描述 。 

在 此 模糊 智能 开发 环境 中 ,定义 了 不 同类 型 的 模糊 隶属 函数 。 如 图 5-8 所 示 ,它们 分 
别 是 三 角形 梯形、 高 斯 形 和 Sin 形 。 

图 5-9 给 出 了 一 个 模糊 控制 器 的 内 部 结构 。 模 糊 控制 器 能 够 对 外 部 系统 进行 监控 ， 
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图 5-9 模糊 控制 器 的 结构 


其 输入 包括 外 部 系统 状态 信息 ,对 这 些 信 息 进行 预 处 理 , 转 换 成 模糊 隶属 函数 的 形式 ;而 
模糊 输入 再 经 过 规则 估 值 ,得 到 模糊 输出 , 即 规则 强度 ,最 后 规则 强度 和 隶属 函数 通过 精 
确 化 过 程 给 出 精确 的 输出 。 因 此 ,模糊 控制 器 的 推理 过 程 主要 包括 如 下 4 个 步骤 。 

(1) 模糊 化 : 接受 输入 变量 的 当前 值 , 并 最 终 把 它们 变换 到 合适 的 范围 中 (如 [一 1， 
1])。 另 外 , 它 可 以 把 所 测 得 的 值 变换 为 语言 项 或 模糊 集 。 准 确 值 ze 通常 变换 为 模糊 集 
合 wzo)。 如 果 测 量 到 的 值 本 身 就 是 不 精确 的 ,就 需要 其 他 的 模糊 集合 。 

(2) 知识 库 : 包含 有 关 变 量 域 的 信息 各 种 归 一 化 方法 .与 语言 变量 相关 的 模糊 集 
合 。 语言 控制 规则 形式 的 规则 库 也 存储 在 知识 库 中 。 

(3) 规则 估 值 : 根据 得 到 的 输入 值 和 知识 库 确 定 有 关 控 制 变 量 的 信息 。 

(4) 清晰 化 : 通过 使 用 合适 的 变换 ,从 决策 逻辑 控制 变量 的 信息 中 得 到 精确 的 控 
制 值 。 

1. 模糊 化 (fuzzification) 

模糊 化 借助 输入 模糊 集合 的 隶属 函数 转变 输入 值 为 隶属 度 , 即 模糊 化 是 根据 模糊 
集合 转变 输入 值 为 隶属 度 值 的 过 程 。 它 把 从 输入 传感器 处 读 到 的 数据 进行 编码 ,根据 
模糊 规则 前 提 条 件 中 的 语言 变量 把 输入 值 进 行 转变 。 每 个 隶属 度 值 均 与 特定 的 模糊 
集合 相关 ,这 个 隶属 度 值 由 该 模糊 集合 导出 。 因 此 ,该 隶属 度 值 称 为 那个 模糊 集合 的 
隶属 度 。 

例如 ,假设 输入 值 是 一 13 下 ,如 图 5-10 所 示 。 为 了 确定 每 个 模糊 集合 的 隶属 度 ,需要 
找到 模糊 集合 与 该 输入 值 的 交 。 

每 个 模糊 集合 的 隶属 度 值 如 下 所 示 。 


Input temperature_error 一 一 13 
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图 5-10 ”temperature_error 的 模糊 集合 在 一 13 下 的 隶属 度 











Label Grade 
Big 0.25 
Medium 0.75 
Small 0.00 





2. 控制 知识 库 的 建立 

在 设计 控制 知识 库 时 有 两 个 主要 任务 。 

(1) 选择 一 组 语言 变量 ,它们 描述 了 被 控制 过 程 的 主要 控制 参数 的 值 。 在 这 一 阶段 ， 
主要 的 输入 参数 和 主要 的 输出 参数 都 需要 使 用 适当 的 术语 集合 通过 语言 进行 定义 ,输入 
变量 或 输出 变量 的 术语 集合 的 粒度 层次 的 选择 在 控制 的 平滑 性 方面 具有 重要 的 作用 。 

(2) 控制 知识 库 使 用 上 面 主要 参数 的 语言 描述 进行 开发 。 开 发 控制 知识 库 的 方法 包括 ;: 
名 专家 的 经 验 与 知识 ; @ 对 操作 者 的 控制 动作 进行 建 模 ; 对 过 程 进行 建 模 ; @ 自 组 织 。 

上 述 方法 中 ,第 一 种 方法 的 应 用 最 广 。 在 描述 人 类 专家 操作 者 的 知识 时 ,模糊 控制 的 
规则 形式 为 

If Error is small and Change-in-error is small,then Force is small. 

当 专 家 在 控制 被 控 过 程 中 使 用 上 述 规则 表达 启发 性 知识 时 ,这 种 方法 非常 有 效 。 这 
种 方法 已 被 用 于 过 程控 制 。 除 了 由 Mamdani 等 人 使 用 的 传统 模糊 控制 规则 外 ,规则 也 可 
表示 为 “其 结论 是 输入 参数 的 函数 "。 例 如 : 

If X is Al and Y is Bl,then Z={f1(X.,Y) 

这 里 ,输出 Z 是 X 和 YY 所 取 值 的 函数 。 

第 二 种 方法 直接 描述 了 操作 者 的 控制 动作 。 这 种 方法 对 操作 者 的 控制 动作 进行 建 模 
而 不 直接 由 操作 者 操作 。Takagi、Sugeno 等 人 已 将 这 种 方法 应 用 于 描述 驾驶 员 在 停车 场 
停车 时 的 控制 动作 。 

第 三 种 方法 涉及 被 控 过 程 的 模糊 模型 ,根据 描述 被 控 系 统 可 能 状态 的 蕴涵 式 生成 被 
控 对 象 的 近似 模型 。 在 这 种 方法 中 ,开发 一 个 模型 并 且 构 造 一 个 控制 该 模糊 模型 的 控制 
器 ,使 得 这 种 方法 与 控制 理论 中 使 用 的 传统 方法 有 些 相似 。 因 此 ,需要 结构 标识 过 程 和 参 
数 标识 过 程 。 例 如 ,规则 的 形式 如 下 。 

If x is Ai, x is Ai…Then y 一 Di 十 pixl 十 … 十 piaxw 
对 所 有 的 i 二 1,2,…,n, 其 中 是 这 些 蕴 涵 式 的 个 数 ,并 且 结 果 是 m 个 输入 变量 的 线性 
函数 。 
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最 后 ,第 四 种 方法 开发 可 以 随时 间 进 行 调整 的 规则 ,以 改进 控制 器 的 性 能 。 

3. 规则 估 值 (rule evaluation ) 算 法 

由 于 模糊 控制 规则 的 部 分 匹配 特性 和 规则 的 前 提 条 件 相 重 友 的 事实 ,通常 在 一 个 时 刻 
可 能 有 多 于 一 条 的 模糊 规则 被 激活 ,用 来 决定 执行 哪个 控制 规则 的 方法 称 为 冲突 消解 过 程 。 

规则 估 值 过 程 确定 了 每 个 规则 被 满足 的 程度 。 在 某 些 状况 下 , 某 些 规则 的 条 件 比 其 
他 规则 的 条 件 更 容易 被 满足 ,从 而 使 得 某 些 规则 比 其 他 规则 更 适用 。 

为 确定 一 个 条 件 被 满足 的 程度 ,每 个 规则 的 输入 集合 都 要 模糊 化 ,每 个 规则 将 有 一 
与 之 相伴 的 等 级 值 。 这 个 等 级 值 决定 了 每 个 规则 的 相对 ”* 夸 码 ”。 

这 个 等 级 值 然后 被 用 于 加 权 规 则 的 结论 。 这 是 通过 根据 输入 模糊 集合 的 等 级 截取 每 
个 输出 模糊 集合 进行 的 。 

在 此 模糊 智能 开发 环境 中 ,系统 通常 采用 如 下 3 种 规则 估 值 算法 : MinMax、Product 
和 BoundedSum 。 

4. 清晰 化 (defuzzification) 算 法 

eho 仍然 需要 进一步 处 理 , 其 处 理 结果 就 是 输出 的 清晰 
化 。 这 一 过 程 生成 非 模糊 化 的 控制 动作 。 为 了 从 截取 后 的 输出 模糊 集中 确定 出 一 个 清晰 
的 值 ， We 先 合并 这 些 输出 模糊 集 。 这 是 通过 把 所 有 的 输出 模糊 集 连 接 起 来 ,并 且 在 所 
有 的 点 上 取 极 大 值 进行 的 。 

这 样 就 得 到 了 表示 全 体 模 糊 规则 的 输出 的 一 个 综合 的 模糊 集 。 有 多 种 策略 用 来 完成 
对 模糊 控制 动作 的 清晰 化 处 理 。 在 模糊 开发 环境 中 通常 实现 3 种 清晰 化 算法 : 重心 法 、 
插值 法 和 真 值 流 法 。 

(1) 重心 法 (center of gravity) 。 重 心 法 是 常用 的 一 种 清晰 化 方法 , 它 包 括 以 下 步骤 : 
中 取 每 个 输出 的 隶属 函数 的 zx 轴 上 的 中 点 ; @ 在 每 个 输出 的 隶属 函数 > 轴 上 标记 规则 强 
度 , 作 为 新 的 上 限 ; @ 计 算出 新 的 隶属 函数 的 区 域 面积 ; @ 清 晰 化 的 输出 是 xz 轴 上 的 中 
点 和 新 的 输出 隶属 函数 的 区 域 面积 的 加 权 平均 。 

(2) 插值 法 (interpolation)。 插 值 法 是 比较 全 面 地 考虑 模糊 量 各 部 分 信息 作用 的 一 
种 方法 。 该 方法 就 是 把 隶属 函数 与 横 坐 标 所 围 成 的 区 域 分 成 两 部 分 ,在 两 部 分 相等 的 情 
况 下 ,两 部 分 分 界 点 对 应 的 横 坐 标 值 即 为 清晰 化 后 的 精确 值 。 

(3) 真 值 流 法 (truth value flow)。 真 值 流 法 是 由 汪 培 庄 提 出 的 一 种 描述 模糊 推理 的 
方法 。 真 值 流 法 认为 ,推理 是 真 值 在 命题 之 间 流 动 的 过 程 。 一 个 推理 句 等 于 一 条 看 不 见 
的 渠道 ,把 首尾 两 个 命题 联结 起 来 ,渠道 本 身 不 产生 真 值 , 它 的 功能 仅仅 是 传递 真 值 。 输 
和 人 的 事实 若 与 前 件 吻合 ,等 于 在 渠 首 输入 了 真 值 1。 渠 道 立即 将 它 传 至 渠 尾 , 故 得 出 结 
论 : Q 真 。 确 定性 的 推理 理论 的 最 大 局 限 在 于 : 事实 与 前 件 必须 完全 匹配 ,模糊 推理 的 
最 大 好 处 就 是 突破 了 这 一 局 限 。 

真 值 流 法 在 推理 过 程 中 需要 的 计算 较 少 。 这 种 方法 使 用 单 点 集 , 而 不 是 模糊 集 描述 
输出 。 该 方法 比 传统 的 Mamdani 在 计算 上 更 有 效 ,其 清晰 化 步骤 被 化 简 了 。 


5.6.5 案例 : 抵押 申请 评估 决策 支持 系统 


抵押 申请 评估 是 决策 支持 模糊 系统 能 够 成 功 应 用 的 典型 问题 (Von Altrock,1997 
年 )。 要 开发 解决 这 个 问题 的 决策 支持 模糊 系统 ,首先 使 用 模糊 术语 表达 抵押 申请 评估 中 
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的 基本 概念 ,然后 用 合适 的 模糊 工具 在 原型 系统 中 实现 这 个 概念 ,最 后 用 选 定 的 测试 
测试 和 优化 系统 。 
抵押 申请 的 评估 通常 基于 评估 市 场 价 和 房产 的 位 置 .申请 人 的 资产 和 收入 ,以 及 还 款 
计划 ,而 这 些 都 取决 于 申请 人 的 收入 和 银行 的 利率 。 
要 定义 隶属 函数 并 构建 模糊 规则 ,需要 有 经 验 的 抵押 顾问 和 银行 经 理 的 帮助 ,他 们 能 
够 列 出 抵押 认可 的 方针 。 图 5-11 一 图 5-18 是 本 问题 中 使 用 的 语言 变量 的 模糊 集 。 三 角 
形 和 梯形 的 隶属 函数 可 以 充分 表示 抵押 专家 的 知识 。 
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5-11 语言 变量 Market_value 的 模糊 集 
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图 5-12 语言 变量 Location 的 模糊 集 
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图 5-13 语言 变量 House 的 模糊 集 
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图 5-14 语言 变量 Asset 的 模糊 集 
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图 5-15 语言 变量 Income 的 模糊 集 
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图 5-16 语言 变量 Applicant 的 模糊 集 
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5-17 语言 变量 Interest 的 模糊 集 

若 
如 
幅 





0 50 100 150 200 250 300 350 400 450 500 x103 
利息 /: 
5-18 语言 变量 Credit 的 模糊 集 






元 


接 下 来 需要 获取 模糊 规则 。 本 例 中 ,我 们 只 是 借用 了 Von Altrock 在 其 抵押 贷款 评 
估 模 糊 模 型 中 使 用 的 基本 规则 。 这 些 规则 如 图 5-19 所 示 .， 


规则 库 1: 住 / 
1. If (Location is Bad) and (Market_value is Low) then (House is Very_low) 

. If (Location is Bad) then (House is Low) 

. If (Market_value is Low) then (House is Low) 

. If (Location is Bad) and (Market_value is Medium) then (House is Low) 

. If (Location is Bad) and (Market_ value is High) then (House is Medium) 

. If (Location is Bad) and (Market_ value is Very_high) then (House is High) 

. If (Location is Fair) and (Market _value is Low) then (House is Low) 

. If (Location is Fair) and (Market_ value is Medium) then (House is Medium) 

9. If (Location is Fair) and (Market_ value is High) then (House is High) 

10. If (Location is Fair) and (Market _value is Very_high) then (House is Very_high) 

11.I1f (Location is Excellent) and (Market _value is Low) then (House is Medium) 

12. If (Location is Excellent) and (Market_ value is Medium ) then (Houseis High) 

13. If (Location is Excellent) and (Market_ value is High) then (House is Very_high) 

14. If (Location is Excellent) and (Market_ value is Very_high) then (House is Very_high) 


图 5-19 抵押 贷款 评估 的 规则 
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规则 库 2: 申 请 评估 

If (Asset is Low) and (Income is Low) then (Applicant is Low) 

If (Asset is Low) and (Income is Medium) then (Applicant is Low) 

If (Asset is Low) and (Income is High) then (Applicant is Medium ) 

If (Asset is Low) and (Income is Very_high) then (Applicant is High) 

If (Asset is Medium) and (Income is Low) then (Applicant is Low) 

If (Asset is Medium) and (Income is Medium) then (Applicant is Medium) 
If (Asset is Medium) and (Income is High) then (Applicant is High) 

If (Asset is Medium) and (Income is Very_high) then (Applicant is High) 
If (Asset is High) and (Income is Low) then (Applicant is Medium) 

10. If (Asset is High) and (Income is Medium) then (Applicant is Medium) 
11. If (Asset is High) and (Income is High) then (Applicant is High) 

12. If(Asset is High) and (Income is Very_high) then (Applicant is High) 


mH 








规则 库 3: 信 用 评估 

1.If (Income is Low) and (Interest is Medium) then (Credit is Very_low) 

2.If (Income is Low) and (Interest is High) then (Credit is Very_low) 

3.If (Income is Medium ) and (Interest is High) then (Credit is Low) 

4.If (Applicant is Low) then (Credit is Very_low) 

5.If (House is Very_low) then (Credit is Very_ low) 

6.If(Applicant is Medium) and (House is Very_low) then (Credit is Low) 
7.If (Applicant is Medium) and (House is Low) then (Credit is Low) 

8.If (Applicant is Medium) and (House is Medium) then (Credit is Medium) 
9.If(Applicant is Medium) and (House is High) then (Credit is High) 
10.If(Applicant is Medium) and (House is Very_high) then (Credit is High) 
11.If(Applicant is High) and (House is Very_low) then (Credit is Low) 
12.If(Applicant is High) and (House is Low) then (Credit is Medium) 
13.If(Applicant is High) and (House is Medium) then (Credit is High) 
14.If(Applicant is High) and (House is High) then (Credit is High) 
15.If(Applicant is High) and (House is Very_high) then (Credit is Very_high) 


图 5-19( 续 ) 











模糊 系统 中 使 用 的 所 有 变量 的 复杂 关系 可 用 层次 结构 表示 ,如 图 5-20 所 示 。 

我 们 使 用 MATLAB 的 模糊 巡 辑 工具 箱 构建 系统 , 它 是 市 场 上 最 常用 的 模糊 工具 
这 

开发 原型 系统 的 最 后 两 个 阶段 是 评价 和 测试 。 

要 评价 和 分 析 模 糊 系 统 的 性 能 ,可 以 使 用 模糊 逻辑 工具 箱 中 提供 的 输出 表面 查看 器 。 
图 5-21 和 图 5-22 为 抵押 贷款 评估 系统 的 三 维 图 。 最 后 ,抵押 专家 使 用 一 些 测 试用 例 测 

决策 支持 模糊 系统 可 能 包含 几 十 甚至 上 百 条 规则 。 例 如 , BMW 银行 和 Inform 
Software 开发 的 信用 风险 评估 模糊 系统 中 使 用 了 413 条 规则 。 大 型 的 知识 库 通常 采用 
类 似 图 5-20 所 示 的 方式 将 其 分 割 成 几 个 模块 。 尽 管 通常 有 大 量 的 规则 ,但 决策 支持 模糊 
系统 可 以 相对 快速 地 开发 ,测试 和 运行 。 
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规则 库 2 : 申请 评估 
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5-20 ”抵押 贷款 评估 的 层次 模型 
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图 5-21 规则 库 1 和 规则 库 2 的 三 维 图 
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5-22 ”规则 库 3 的 三 维 图 


5.7 小 结 


本 章 首先 讨论 了 不 确定 性 推理 的 基本 概念 ,以 及 不 确定 性 研究 的 主要 问题 和 主要 研 
究 方法 。 这 里 讨论 的 “不 确定 性 ?是 针对 已 知事 实 和 推理 中 所 用 到 的 知识 而 言 的 ,应 用 这 
种 不 确定 的 事实 和 知识 的 推理 称 为 不 确定 性 推理 。 

目前 关于 不 确定 性 处 理 方 法 的 研究 ,主要 沿 两 条 路 线 发 展 : 一 是 在 推理 一 级 扩展 确 
定性 推理 ,建立 各 种 不 确定 性 推理 的 模型 。 它 又 分 为 数值 方法 和 非 数值 方法 。 本 章 主 要 
讨论 的 是 数值 方法 ,如 概率 方法 、 主 观 Bayes 方法 .可 信 度 方法 .证 据 理 论 、 模 糊 方 法 等 。 
另 一 条 路 线 是 在 控制 一 级 上 处 理 不 确定 性 , 称 为 控制 方法 。 对 于 处 理 不 确定 的 最 优 方法 ， 
现在 还 没有 一 个 统一 的 意见 。 

在 本 章 讨论 的 方法 中 ,概率 方法 是 一 个 以 概率 论 中 有 关 理 论 为 基础 建立 的 纯 概 率 方 
法 ,由 于 在 使 用 过 程 中 需要 事先 确定 给 出 先 验 概 率 和 条 件 概率 ,并 且 计 算 量 较 大 ,因此 应 
用 受到 了 限制 。 主 观 Bayes 方法 、 确 定性 因子 方法 .证 据 理论 .模糊 理论 等 方法 都 是 处 理 
专家 系统 中 不 确定 性 的 方法 。 

主观 Bayes 方法 通过 使 用 专家 的 主观 概率 ,避免 了 所 需 的 大 量 统计 计算 工作 。 在 主 
观 Bayes 方法 中 ,讨论 了 信任 与 概率 的 关系 ,以 及 似 然 性 问题 ,介绍 了 主观 Bayes 方法 知 
识 表示 和 推理 方法 。 

确定 性 因子 方法 比较 简单 .直观 ,易于 掌握 和 使 用 ,并 且 已 成 功 应 用 于 如 MYCIN 这 
样 的 推理 链 较 短 、 概 率 计算 精度 要 求 不 高 的 专家 系统 中 。 但 是 , 当 推理 长 度 较 长 时 ,由 可 
信 度 的 不 精确 估计 而 产生 的 积累 误差 会 很 大 ,所 以 它 不 适合 长 推理 链 的 情况 。 

证 据 理论 是 用 集合 表示 命题 的 一 种 处 理 不 确定 性 的 理论 , 它 引 入 信任 函数 而 非 概率 
度量 不 确定 性 ,并 引入 似 然 函 数 处 理 不 知道 所 引起 的 不 确定 性 问题 , 它 只 需要 满足 比 概率 
论 更 弱 的 公理 系统 。 证 据 理论 基础 严密 ,专门 针对 专家 系统 ,是 一 种 很 有 吸引 力 的 不 确定 
性 推理 模型 。 但 如 何 把 它 普遍 应 用 于 专家 系统 ,目前 还 没有 一 个 统一 的 意见 。 

与 不 确定 推理 处 理 随 机 事件 发 生 的 可 能 性 对 照 ,模糊 逻辑 面 向 事物 特征 和 能 力 的 不 
精确 描述 。 模 糊 理论 是 在 模糊 集合 理论 基础 上 发 展 起 来 的 ` 已 经 系统 化 的 关于 不 确定 性 
的 最 一 般 理论 ,由 于 扩张 原理 等 方法 ,使 得 模糊 推理 得 以 广泛 应 用 ,目前 已 经 应 用 到 许多 
领域 。 本 章 介绍 了 模糊 理论 和 模糊 推理 的 主要 方法 ,并 以 一 个 智能 模糊 推理 系统 中 模糊 
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推理 的 方法 作为 示例 。 

谷歌 建 全 球 最 大 知识 库 Knowledge Vault, 该 知识 库 通 过 算法 自动 搜集 网 上 信息 , 通 
过 机 器 学 习 把 数据 变 成 可 用 知识 。2014 年 ,Knowledge Vault 已 经 收集 了 16 亿 件 事实 ， 
其 中 ,2.71 亿 件 是 “可 信 的 事实 *"。 这 里 的 可 信和 是 说 ,Google 把 新 事实 与 已 掌握 知识 对 照 
后 ,认为 其 准确 的 可 能 性 是 90%。 未 来 ,Knowledge Vault 可 以 驱动 一 个 现实 增强 系统 ， 
让 我 们 从 头 戴 显示 屏 上 了 解 现实 世界 中 的 地 标 、 建 筑 、 商 业 网 点 等 信息 。 

李 德 妆 院士 在 统一 主观 认 知 和 客观 现象 中 的 随机 性 和 模糊 性 方面 提出 了 不 确定 性 人 
工 智能 的 研究 问题 。 不 确定 性 人 工 智能 认为 ,随机 性 和 模糊 性 常常 是 联系 在 一 起 的 ,在 人 
类 思维 和 智能 行为 中 难以 区 分 并 独立 存在 ,研究 不 确定 性 需要 研究 随机 性 和 模糊 性 之 间 
的 关联 性 。 李 德 娄 院士 提出 了 一 种 称 为 云 模型 的 表示 统一 刻画 人 类 语言 中 大 量 存在 的 随 
机 性 、 模 糊 性 以 及 两 者 之 间 的 关联 性 ,把 云 模型 作为 用 语言 值 描述 的 某 个 定性 概念 与 其 数 
值 表示 之 间 的 不 确定 性 转换 模型 。 

尽管 这 些 技术 大 多 数 是 从 实践 中 总 结 出 来 的 工程 性 方法 ,对 不 确定 性 的 处 理 往往 不 
够 严格 ,使 用 上 也 有 很 多 局 限 性 ,但 是 它们 却 能 解决 一 些 问题 ,其 结果 能 够 给 出 令 人 满意 
的 解释 ,符合 人 类 认识 世界 的 直觉 。 用 阿尔 伯 特 。 爱 因 斯 坦 的 话说 “适用 于 现实 世界 的 数 
学 定律 都 不 具有 确定 性 ,具有 确定 性 的 数学 定律 则 不 适用 于 现实 世界 。” 


习题 


5.1 传统 迎 辑 的 局 限 性 是 什么 ?什么 是 非 单 调 推理 ? 非 单调 推理 主要 应 用 于 哪些 场合 ? 
5.2 在 缺 省 理论 中 , 缺 省 规则 是 如 何 表示 的 ? 有 哪儿 种 表示 形式 ? 
5.3 ”用 缺 省 理论 表示 下 面 的 句子 ,并 给 出 D 和 W 集合 。 
(a) 有 些 软体 动物 (molluscs) 是 有 壳 动 物 (shell-bearers) 。 
(b) 头 足 类 动物 (cephalopods) 是 软体 动物 。 
(c) 头 足 类 动物 不 是 有 壳 动 物 。 
5.4 用 缺 省 逻辑 表示 下 面 的 句子 。 
(a) John 是 高 校 毕 业 生 。 
(b) 通常 ,高 校 毕 业 生 都 是 成 年 人 。 
(c) 通常 ,成 年 人 都 有 工作 。 
确定 该 缺 省 逻辑 的 扩充 。 该 扩充 在 逻辑 上 合理 吗 ? 
5.5 已 知 A= 王 <<D, 友 >, 其 中 
(1) 克 =g, 求 和 的 扩充 下 。 
(2) W={ 了 BV("AA 了 0C)}, 求 A 的 扩充 E。 
5.6 什么 是 不 确定 推理 ? 不 确定 性 推理 的 基本 问题 是 什么 ? 
5.7 何谓 随机 性 ? 试 举 出 几 个 随机 现象 的 实例 ? 
5.8 在 主观 Bayes 方法 中 ,如何 引入 规则 的 强度 的 似 然 率 计 算 条 件 概率 ? 这 种 方法 的 优 
点 是 什么 ? 主观 Bayes 方法 有 什么 问题 ? 试 说 明 LS 和 LN 的 意义 。 
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5.9 


设 有 如 下 规则 : 

a a LS=10, LN=1 

ra: E>H LS=20; LN=1 

rs: Es—H, LS=1， LN=0.002 


已 知 H、Hi 的 先 验 概率 P(H)==0.03、P(Hi)==0. 3。 
(1) 车 证 据 E, 、E。 依次 出 现 , 按 主观 Bayes 推理 , 求 H 在 此 条 件 下 的 概率 P(H | 


E ,E,).。 

(2) 对 rs 求 PCHI|E;),P(Hi| 一 Es) 的 值 各 是 多 少 ? 
设 有 如 下 规则 : 

n: EH LS=20, LN=1 


ra: E>H LS 一 300， LN=1 
已 知 理 的 先 验 概率 P(H) 二 0.03, 若 证 据 E,、E; 依次 出 现 , 按 主观 Bayes 推理 , 求 
理 在 此 条 件 下 的 概率 P(HI|E, 、E,)。 

为 什么 要 在 MYCIN 中 提出 确定 性 因子 方法 ? MYCIN 的 确定 性 方法 有 什么 
问题 ? 

何谓 可 信和 度 ? 说 明 规则 强度 CF( 互 ,BE) 的 含义 。 

假设 有 如 下 一 组 推理 规则 : 


ns 五 一石: (0.6) 
re: E: NEs—>E, (0.8) 
rs: E>H (0.7) 
re: E>H (0.9) 


且 已 知 CF(E,)=0.5,CF(E;) 二 0.6,CF(E;) 二 0.4, 求 CF( 昌 ) 的 值 。 

设 有 下 述 规 则 : 

n: Ai 一 B; CF(Bi,A1)=0.8 

rs: As—B, CF(Bi,A,)=0.5 

rs: B, AAs—>B, CF(B,,B NMA;s)=0.8 

初始 证 据 A ,A ,As 的 CF 值 均 设 为 1, 而 初始 未 知 证 据 Bi ,B, 的 CF 值 为 0, 即 对 
Bi ,B; 是 一 无 所 知 的 。 

求 : CF(B),CF(B,) 的 更 新 值 。 


设 有 下 述 规则 : 
nm: Ai 一 Bi CFCB, ,Ai) 一 0.8 
re: A: 一 Bi CFCB, ,A:) 一 0.6 


m: BIVAs»B, CF(B,,BiVA;:)=0.8 

初始 证 据 Al 、As .As 的 CF 值 均 设 为 0.5, 而 B, 、B, 的 初始 CF 值 分 别 为 0.1 和 0.2。 
求 : CF(Bi)、CF(B,) 的 更 新 值 。 

如 何 用 证 据 理 论 描述 假设 .规则 和 证 据 的 不 确定 性 ,并 实现 不 确定 性 的 传递 和 
组 合 ? 

已 知 fi(E)=0.8, fi(E)=0.6,IU| =20, E, E>H={h,h,} (cl,c2)= 
(0.350.5), 计 算 方 ( 互 ) 。 


5. 23 
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考生 考试 成 绩 的 论 域 为 (A,B,C,D,E), 小 王 成 绩 为 A、 为 B. 为 A 或 B 的 基本 概 
率 分 别 分 配 为 0.2、0.1、0.3。Bel({C,D,E}) 二 0.2。 请 给 出 Bel({A,B})、PL({A， 
B})) 和 f/f({A,B))。 
何谓 模糊 性 ? 它 与 随机 性 有 什么 区 别 ? 试 举 出 几 个 日 常生 活 中 的 模糊 概念 。 
模糊 逻辑 的 基本 思想 是 什么 ?说 明 模 糊 控制 器 的 结构 以 及 各 主要 模块 的 功能 。 
设 有 论 域 U = 二 {z1 ,zs ,Xs,T4,Xs},A、B 是 U 上 的 两 个 模糊 集 , 且 有 

A=0.85/zi 二 0.7/z; 十 0.9/zs 十 0.9/z4 十 0.7/zxs 

也 一 0.5/zi 十 0.65/za 十 0.8/zs 十 0.98/zt 十 0.77/zs 
求 ANB.AUB 和 一 A 的 值 。 
(思考 题 ) 考虑 图 5-23 中 的 汽车 诊断 网 络 , 其 中 每 个 变量 都 是 布尔 型 的 ,并 且 其 取 
值 为 true 时 表示 汽车 相应 的 部 件 工 作 正 常 或 者 状态 正常 。 
(1) 扩展 网 络 , 使 其 含有 变量 IcyWeather 和 StarterMotor。 
(2) 为 所 有 变量 给 出 合理 的 CPT( 条 件 概率 表 ) 。 
(3) 这 8 个 布尔 变量 结 点 的 联合 概率 分 布 中 包含 多 少 个 独立 的 值 ,假设 它们 之 间 
没有 已 知 的 条 件 独 立 关系 ? 
(4) 你 的 网 络 的 表 中 包含 多 少 个 独立 的 概率 值 ? 
(5) Starts 的 条 件 分 布 可 以 描述 为 噪声 与 (noisy-AND) 分 布 。 定 义 这 个 家 族 的 一 
般 形 式 , 并 分 析 其 与 噪声 或 (noisy-OR) 的 联系 。 
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oss) 
图 5-23 ”一 个 描述 汽车 电气 系统 与 引擎 的 某 些 特征 的 贝 叶 斯 网 络 
(思考 题 ) 在 你 本 地 的 核电 站 里 有 一 个 报警 器 , 当 温度 测量 仪 的 温度 超过 给 定 警戒 
闽 值 时 就 会 报警 。 这 个 温度 测量 仪 测量 的 是 核反应 堆 核 心 的 温度 。 考 虑 布尔 变量 
A( 报 警 器 响 ) .FaA( 报 警 器 出 故障 )、Fe( 测 温 仪 出 故障 )、 多 值 变量 G( 测 温 仪 读数 ) 
与 工 (核反应 堆 核 心 的 实际 温度 ) 。 
(1) 画 出 这 个 问题 域 的 贝 叶 斯 网 络 ,假设 当 核心 温度 太 高 时 测量 仪 更 容易 出 故障 。 
(2) 你 得 到 的 贝 叶 斯 网 络 是 多 形 树 结构 吗 ? 为 什么 ? 
(3) 假设 温度 测量 值 C 和 真实 值 工 只 有 两 种 情况 : 正常 或 偏 高 ; 当 测 温 仪 正常 工 
作 时 它 给 出 正确 读数 的 概率 为 zx, 出 现 故障 时 给 出 正确 读数 的 概率 为 y。 给 出 
与 G 相关 的 条 件 概 率 表 。 
(4) 假设 报警 器 能 够 正常 工作 一 一 除非 它 坏 了 ,这 种 情况 它 不 会 发 出 报警 声 。 给 
出 与 A 相关 联 的 条 件 概率 表 。 





236 ps 工大 能 ( 荔 3 瞩 ) 


5. 24 


5. 25 


(5) 假设 报警 器 和 测 温 仪 都 正常 工作 ,并 且 报 警 器 发 出 了 警报 声 。 根 据 网 络 中 的 
各 种 条 件 概 率 , 计 算 核反应 堆 核 心 温度 过 高 的 概率 的 表达 式 。 
(思考 题 ) 考虑 图 5-24 中 的 贝 叶 斯 网 络 ,其 中 布尔 变量 B= BrokeElectionLaw， 
I=Indicted, M= Politically MotivatedProsecutor,G=FoundGuilty ,J = Jailed, 
(1) 网 络 结构 能 够 断言 下 列 哪些 语句 ? 
(CD P(B,I, M)=P(B)P(DP(M) 
Ci) P(JIG)=P(JIG, D 
(iii) PCMIG, B, D=P(M | G, B,I, J) 
(2) 计算 P(B,I, 一 M,G,J) 的 值 。 
(3) 计算 某 个 人 如 果 触 犯 了 法 律 、 被 起 诉 ,而 且 面 临 一 个 有 政治 动机 的 检举 人 ,他 
会 进 监狱 的 概率 。 
特定 上 下 文 独立 性 允许 一 个 变量 在 给 定 其 他 变量 某 些 值 时 独立 于 它 的 某 些 父 
结 点 。 除 了 图 结构 给 定 的 通常 的 条 件 独立 性 以 外 ,图 5-24 的 贝 叶 斯 网 络 中 还 
存在 什么 样 的 特定 上 下 文 独立 性 。 
(5) 假设 想 在 网 络 中 加 入 变量 P= 二 Presidential Pardon; 请 画 出 新 网 络 , 并 简要 解 
释 你 所 加 入 的 边 。 
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图 5-24 一 个 具有 布尔 变量 B,I,M,G,J 的 简单 贝 叶 斯 网 络 


(思考 题 ) 小 型 动物 分 类 专家 系统 。 采 用 问答 方式 辨别 出 用 户 意 中 的 动物 。 使 用 动 
态 数据 库 修改 技术 , 即 在 运行 时 插入 新 信息 ,删除 旧 信息 。 采 用 分 级 归结 的 方式 ， 
即 动 物 从 最 基本 的 特征 开始 确定 ,一 级 一 级 地 往 上 归结 ,每 一 级 作为 一 个 小 的 归结 
结果 。 

例如 ,利用 PROLOG 建造 了 一 个 小 型 动物 分 类 专家 系统 ,采用 问答 方式 辨别 出 用 
户 意 中 的 7 种 动物 之 一 。 下 面 是 一 段 同 专家 系统 的 会 话 。 

Goal: run. 

has it hair /* 你 意 中 的 动物 有 毛发 吗 ? * / 

yes /x 有 .x*/ 
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does it eat meat /* 该 动物 是 食肉 动物 吗 ? * / 
/* 是 x/ 

has it a towny-color ”/* 该 动物 是 淡 黄 褐色 的 吗 ? * / 
yes /x* 是 */ 

has it black spots /* 该 动物 有 黑色 斑点 吗 ? * / 
yes /* 有 x*/ 


your animal may be a(n)cheetah! 


/* 你 意 中 的 动物 可 能 是 豹 * / 


第 和 章 
Agent 


随 着 计算 机 技术 、 人 工 智 能 技术 、 互 联网 和 万 维 网 的 发 展 , Agent 和 多 
Agent 系统 的 研究 成 为 人 工 智能 研究 的 一 个 热点 ,为 分 布 式 系统 的 综合 、 分 
析 、 实 现 和 应 用 开辟 了 一 条 新 的 途径 ,促进 人 工 智 能 和 软件 工程 的 发 展 。 本 
章 内 容 包 括 Agent 的 基本 概念 ,Agent 间 的 通信 与 合作 、 移 动 Agent、 多 
Agent 系统 开发 框架 JADE 以 及 火星 探矿 机 器 人 案例 。 


6.1 概述 


分 布 式 人 工 智 能 (Distributed Artificial Intelligence、DAI) 系 统 能 够 克 
服 单个 智能 系统 在 资源 .时空 分 布 和 功能 上 的 局 限 性 ,具备 并 行 、 分 布 、 开 放 
和 容错 等 优点 ,因而 获得 很 快 的 发 展 ,得 到 越 来 越 广泛 的 应 用 。 

DAI 的 研究 源 于 20 世纪 70 年 代 末 期 ,当时 主要 研究 分 布 式 问题 求解 
(Distributed Problem Solving,DPS) ,其 目标 是 要 建立 一 个 由 多 个 子 系统 构 
成 的 协作 系统 ,各 子 系统 之 间 协 同 工 作 对 特定 问题 进行 求解 。 在 DPS 系统 
中 ,把 待 解决 的 问题 分 解 为 一 些 子 任务 .并 为 每 个 子 任务 设计 一 个 问题 求解 
的 任务 执行 子 系统 。 通 过 交互 作用 策略 ,把 系统 设计 集成 为 一 个 统一 的 整 
体 , 并 采用 自 项 向 下 的 设计 方法 ,保证 问题 处 理 系统 能 够 满足 顶部 给 定 的 

分 布 式 人 工 智能 系统 具有 如 下 特点 。 

(1) 分 布 性 。 整 个 系统 的 信息 ,包括 数据 ` 知 识 和 控制 等 ,逻辑 上 和 物理 
上 都 是 分 布 的 ,不 存在 全 局 控制 和 全 局 数据 存储 。 系 统 中 的 各 路 径 和 结 点 都 
能 够 并 行 地 求解 问题 ,从 而 提高 了 子 系统 的 求解 效率 。 

(2) 连接 性 。 在 问题 求解 过 程 中 ,各 个 子 系统 和 求解 机 构 通过 计算 机 网 
络 相互 连接 ,降低 了 求解 问题 的 通信 代价 和 求解 代价 。 

(3) 协作 性 。 各 子 系统 协调 工作 ,能够 求解 单个 机 构 难 以 解决 或 者 无 法 
解决 的 困难 问题 。 例 如 ,多 领域 专家 系统 可 以 协作 求解 单个 专家 系统 无 法 解 
决 的 问题 ,提高 求解 能 力 , 扩 大 应 用 领域 。 

(4) 开放 性 。 通 过 网 络 互联 和 系统 的 分 布 ,便于 扩充 系统 规模 ,使 系统 
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的 开放 性 和 灵活 性 比 单个 系统 更 好 。 

(5) 容错 性 。 系 统 具 有 和 较 多 的 元 余 处 理 结 点 .通信 路 径 和 知识 ,能 够 使 系统 在 出 现 故 
障 时 仅 通过 降低 响应 速度 或 求解 精度 ,就 可 以 保持 系统 正常 工作 ,提高 工作 可 靠 性 。 

(6) 独立 性 。 系 统 把 求解 任务 归 约 为 几 个 相对 独立 的 子 任务 ,从 而 降低 了 各 个 处 理 
结 点 和 子 系统 问题 求解 的 复杂 性 ,也 降低 了 软件 设计 开发 的 复杂 性 。 

分 布 式 人 工 智能 一 般 分 为 分 布 式 问 题 求 解 (DPS) 和 多 Agent 系统 (Multi-Agent 
System,MAS) 两 种 类 型 。DPS 研究 如 何在 多 个 合作 和 共享 知识 的 模块 、 结 点 或 子 系统 之 
间 划 分 任务 ,并 求解 问题 。MAS 则 研究 如 何在 一 群 自 主 的 Agent 之 间 进 行 智能 行为 的 
协调 。 两 者 的 共同 点 在 于 研究 如 何 对 资源 .知识 .控制 等 进行 划分 。 两 者 的 不 同 点 在 于 ， 
DPS 往往 需要 有 全 局 的 问题 .概念 模型 和 成 功 标 准 , 而 MAS 则 包含 多 个 局 部 的 问题 、 概 
念 模型 和 成 功 标准 。DPS 的 研究 目标 在 于 建立 大 粒度 的 协作 群体 ,通过 各 群体 的 协作 实 
现 问 题 求解 ,并 采用 自 顶 向 下 的 设计 方法 。MAS 却 采用 自 底 向 上 的 设计 方法 ,首先 定义 
各 自分 散 自主 的 Agent, 然 后 研究 怎样 完成 实际 任务 的 求解 问题 。 各 个 Agent 之 间 的 关 
系 并 不 一 定 是 协作 的 ,也 可 能 是 竞争 ,甚至 是 对 抗 的 关系 。 

有 人 认为 MAS 基本 上 就 是 分 布 式 人 工 智 能 ,DPS 仅 是 MAS 研究 的 一 个 子 集 , 他 们 
提出 , 当 满足 下 列 3 个 假设 时 ,MAS 就 成 为 DPS 系统 : DAgent 友好 ; @ 目 标 共 同 ; @ 集 
中 设计 。 正 是 由 于 MAS 具有 更 大 的 灵活 性 ,更 能 体现 人 类 社会 的 智能 ,更 适应 开放 和 动 
态 的 世界 环境 ,因而 引起 许多 学 科 及 其 研究 者 的 强烈 兴趣 和 高 度 重 视 。 目 前 研究 的 问题 
包括 Agent 的 概念 、 理 论 、 分 类 、 模 型 .结构 语言、 推理 和 通信 等 。 

Agent 技术 ,特别 是 多 Agent 技术 ,为 分 布 开放 系统 的 分 析 、` 设 计 和 实现 提供 了 一 种 
菜 新 的 方法 ,被 誉 为 “软件 开发 的 又 一 重大 突破 ”。Agent 技术 已 被 广泛 应 用 到 各 个 领域 。 
Agent 及 其 相关 概念 和 技术 最 早 源 于 分 布 式 人 工 智 能 (DAD ,但 从 20 世纪 80 年 代 末 开 
始 ,Agent 技术 从 DAI 领域 中 拓展 开 来 ,并 与 许多 其 他 领域 相互 借鉴 和 融合 ,在 许多 不 同 
于 最 初 DAI 应 用 的 领域 得 到 更 为 广泛 的 应 用 。 面 向 Agent 技术 (AOT) 作 为 一 种 设计 和 
开发 软件 系统 的 新 方法 已 经 得 到 学 术 界 和 企业 界 的 广泛 关注 。 

目前 ,对 Agent 的 研究 大 致 分 为 如 下 3 个 相互 关联 的 方面 : 智能 Agent; 四 多 
Agent 系统 (MAS); 四 面向 Agent 的 程序 设计 (AOP)。 智 能 Agent 是 多 Agent 系统 研 
究 的 基础 ,我 们 也 可 以 将 智能 Agent 的 研究 统一 在 MAS 的 研究 框架 下 ,这 样 ,智能 
Agent 被 看 成 MAS 研究 中 的 微观 层次 ,主要 研究 Agent 的 理论 和 结构 ,包括 Agent 的 概 
念 , 特 性 、 分 类 ,Agent 的 形式 化 表示 和 推理 等 ;而 有 关 Agent 间 的 关系 的 研究 则 构成 了 
MAS 研究 的 宏观 层次 , 它 主要 研究 由 多 个 Agent 组 成 的 系统 中 Agent 的 组 织 以 及 Agent 
间 的 通信 ,规划 、 协 同 、 协 作 、 协 商 与 冲突 消解 、 自 组 织 和 自学 习 等 问题 。 智 能 Agent 和 
MAS 的 成 功 应 用 要 借助 Agent 的 应 用 方法 ( 即 AOP) 以 及 AOP 开发 工具 或 平台 。 

随 着 网 络 技术 和 分 布 式 技术 ,尤其 是 Internet/ WWW 技术 的 日 益 发 展 和 其 应 用 的 不 
断 深入 ,Agent 技术 在 Internet 上 的 应 用 及 相关 研究 变 得 愈加 活跃 。White,Chess 等 人 
认为 移动 Agent 是 具有 移动 性 的 智能 Agent。Gilbert 等 人 把 移动 Agent 作为 软件 
Agent 的 一 个 重要 分 支 , 他 们 给 出 了 软件 Agent 的 分 类 ,其 中 把 移动 性 作为 分 类 的 一 个 标 
准 。 图 6-1 描述 了 他 们 给 出 的 软件 Agent 的 分 类 空间 。 

软件 Agent 被 描述 为 由 智能 性 、 代 理 和 移动 性 组 成 的 一 个 三 维 空间 。 智 能 性 用 偏 
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代理 (Agency) 
服务 交互 性 (service interactivity ) 
应 用 交互 性 (application interactivity ) 
数据 交互 性 (data interactivity ) 
代表 用 户 (representation ofuser) 


异步 (asynchronity ) 


intelli 
消息 传递 (message passing) 智能 性 (intelligence) 


RPC(Remote Procedure Call) 偏好 推理 规划 学 习 
REV(Remote Evaluation) preference reasoning planning learning 
弱 移 动 (weak migration) 
强 移动 (strong migration) 





移动 性 (mobility) 
图 6-1 软件 Agent 的 分 类 空间 


好 ,推理 ,规划 、 学 习 刻 画 Agent 表达 信念 ,情感 的 能 力 和 完成 任务 的 能 力 。 代 理 刻画 了 
Agent 的 自主 程度 和 享有 权限 的 大 小 ,可 以 用 Agent 与 其 他 实体 的 交互 能 力度 量 。 按 照 
他 们 的 观点 ,Agent 至 少 能 够 异步 地 执行 ,代理 能 力 强 的 Agent 可 以 在 一 定 程 度 上 代表 用 
户 的 利益 ,甚至 能 代表 用 户 与 其 他 Agent 或 用 户 交 互 。 按 照 代理 能 力 的 强 弱 , Agent 被 称 
为 自主 的 (Cautonomous)、 合 作 的 (collaborative)、 协作 的 (cooperative) 或 协商 的 
(negotiating) 。 移 动 性 刻画 Agent 的 移动 能 力 ,移动 Agent 可 以 采用 传统 的 通信 机 制 (如 
消息 传递 .RPC 和 REV 等 ) 进 行 远程 通信 ,也 可 以 采用 弱 移 动 或 强 移动 方式 移动 到 远程 
主机 进行 本 地 通信 。 

经 过 近 30 年 的 发 展 ,多 Agent 系统 已 经 成 为 国际 人 工 智能 领域 的 前 沿 和 研究 热点 。 
在 近年 来 的 AAAI 人 工 智 能 会 议和 国际 人 工 智 能 联合 会 议 (International Joint 
Conference on Artificial Intelligence，IJCAI) 上 录用 的 关于 多 Agent 系统 的 文章 数量 一 
直 名 列 前 两 位 。 多 Agent 系统 领域 的 创始 人 Victor Lesser 教授 于 2009 年 获得 了 IJCAI 
杰出 研究 奖 。 


6.2 Agent 及 其 结构 


6.2.1 Agent 的 定义 


所 谓 Agent, 是 指 驻 留 在 某 一 环境 下 能 够 自主 (autonomous)、 灵 活 (flexible) 地 执行 
动作 ,以 满足 设计 目标 的 行为 实体 。 

上 述 定 义 具有 如 下 两 个 特点 。 

(1) 定义 方式 。Agent 的 概念 定义 是 基于 Agent 的 外 部 可 观察 行为 特征 ,而 不 是 基 
于 其 内 部 的 结构 。Agent 的 概念 定义 仅 描述 了 作为 Agent 的 行为 实体 应 具有 的 外 在 行为 
特点 ,没有 描述 作为 行为 实体 的 Agent 应 具有 什么 样 的 内 部 结构 以 及 如 何 通过 其 内 部 结 
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构 实 现 其 自主 灵活 的 行为 。Agent 概念 的 这 种 定义 方式 抛 开 了 Agent 的 内 部 结构 和 实 
现 细节 ,刻画 了 作为 Agent 的 外 在 公共 和 基本 的 性 质 和 特征 ,有 助 于 脱离 具体 的 技术 实 
现 细节 在 一 个 较 高 的 技术 层次 上 分 析 和 讨论 应 用 系统 和 软件 系统 中 的 行为 实体 ,缓解 了 
不 同 研究 领域 和 应 用 领域 的 专家 和 学 者 就 有 关 Agent 概念 的 争论 。 

(2) 抽象 层次 。Agent 概念 更 加 贴近 人 们 对 现实 世界 (而 不 是 计算 机 世界 ) 中 行为 实 
体 的 理解 。 我 们 不 仅 可 以 用 Agent 概念 表示 现实 世界 中 的 行为 实体 ,而 且 还 可 以 用 它 表 
示 计 算 机 世界 中 的 软件 实体 ,因而 有 助 于 缩小 现实 世界 中 的 应 用 系统 到 其 模型 以 及 最 终 
的 软件 系统 之 间 的 概念 差距 。 与 过 程 、 对 象 等 概念 相 比 ,Agent 是 一 个 更 抽象 的 概念 , 因 
而 可 以 在 一 个 更 高 的 抽象 层次 上 对 应 用 系统 和 软件 系统 中 的 行为 实体 进行 自然 分 析 和 建 
模 ,减少 系统 开发 的 复杂 性 ,并 有 助 于 实现 从 需求 模型 到 设计 模型 的 自然 过 渡 。 


6.2.2 Agent 要 素 及 特性 


Agent 在 英语 中 是 一 个 多 义 词 , 主 要 含义 有 主动 者 、 代 理 人 、 作 用 力 ( 因 素 ) 或 媒介 物 
( 体 ) 等 。 在 人 工 智能 和 计算 机 领域 ,可 把 Agent 看 作 是 能 够 通过 传感器 感知 其 环境 ,并 
借助 执行 器 作用 于 该 环境 的 任何 事物 。 把 人 视 为 Agent, 其 传感器 为 眼睛 、 耳 人 打 和 其 他 感 
官 ,其 执行 器 为 手 、 腿 、 嘴 和 其 他 身体 部 分 。 对 于 机 器 人 Agent, 其 传感器 为 摄像 机 和 红外 
测 距 器 等 ,而 各 种 马达 为 其 执行 器 。 对 于 软件 Agent, 通 过 编码 位 的 字符 串 进行 感知 和 作 
用 。Agent 通过 传感器 和 执行 器 与 环境 的 交互 作用 如 图 6-2 所 示 。 
传感器 








图 6-2 Agent 通过 传感器 和 执行 器 与 环境 的 交互 作用 


目前 国内 对 Agent 尚 无 公认 的 统一 译 法 。 译 文 包括 智能 体 、 主 体 、 智 能 主体 、 智 体 、 
代理 、 艾 真 体 、 真 体 、 媒 体 \ 个 体 、 实 体 等 。 本 书 沿用 英文 原文 。 

1. Agent 的 要 素 

Agent 必须 利用 知识 修改 其 内 部 状态 (心理 状态 ) ,以 适应 环境 变化 和 协作 求解 的 需 
要 。Agent 的 行动 受 其 心理 状态 驱动 。 人 类 心理 状态 的 要 素 有 认 知 (信念 、 知 识 、 学 习 
等 ) ,情感 (愿望 兴趣、 爱好 等 ) 和 意向 (意图 \ 目 标 、 规 划 和 承诺 等 )3 种 。 着 重 研究 信念 
(belief) .愿望 (desire) 和 意图 (intention) 的 关系 及 其 形式 化 描述 ,力图 建立 Agent 的 BDI 
(信念 ,愿望 和 意图 ) 模 型 ,已 成 为 Agent 理论 模型 研究 的 主要 方向 。 

信念、 愿望 意图 与 行为 具有 某 种 因果 关系 ,如 图 6-3 所 示 。 其 中 ,信念 描述 Agent 对 
环境 的 认识 ,表示 可 能 发 生 的 状态 ;愿望 从 信念 直接 得 到 ,描述 Agent 对 可 能 发 生 情景 的 
判断 ;意图 来 自愿 望 , 制 约 Agent, 是 目标 的 组 成 部 分 。 
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图 6-3 BDI 关 系 图 





Bratman 的 哲学 思想 对 心理 状态 研究 产生 了 深刻 影响 。1987 年 ,他 从 哲学 的 角度 研 
究 行 为 意图 ,认为 只 有 保持 信念 \ 愿 望 和 意图 的 理性 平衡 ,才能 有 效 地 实现 问题 求解 。 他 
还 认为 ,在 某 个 开放 的 世界 (环境 ) 中 ,理性 Agent 的 行为 不 能 由 信念 ,愿望 及 两 者 组 成 的 
规划 直接 驱动 ,在 愿望 和 规划 之 间 还 存在 一 个 基于 信念 的 意图 。 在 这 样 的 环境 中 ,这 个 意 
图 制约 了 理性 Agent 的 行为 。 理 性 平衡 是 使 理性 Agent 的 行为 与 环境 特性 相 适应 。 环 
境 特 性 不 仅 包括 环境 客观 条 件 , 而 且 涉 及 环境 的 社会 团体 因素 。 对 于 每 种 可 能 的 感知 序 
列 , 在 感知 序列 提供 证 据 和 Agent 内 部 知识 的 基础 上 ,一 个 理想 的 理性 Agent 的 期 望 动 
作 应 使 其 性 能 测度 达到 最 大 。 

在 Agent 和 MAS 的 建 模 方面 ,几乎 所 有 研究 工作 都 以 实现 Bratman 的 哲学 思想 为 
目标 。 不 过 ,这 些 研究 都 未 能 完全 实现 Bratman 的 哲学 模型 ,仍然 存在 一 些 尚 待 进一步 
研究 和 解决 的 问题 ,如 Agent 模型 与 结构 的 映射 关系 、 建 造 Agent 系统 的 计算 复杂 性 以 
及 Agent 问题 求解 与 心理 状态 关系 的 表示 等 问题 。 

2. Agent 的 特性 

Agent 与 分 布 式 人 工 智能 系统 一 样 具有 协作 性 、 适 应 性 等 特性 。 此 外 ,Agent 还 具有 
自主 性 、 交 互 性 以 及 持续 性 等 重要 性 质 。 

(1) 行为 自主 性 。Agent 能 够 控制 它 的 自身 行为 ,其 行为 是 主动 的 、 自 发 的 有 目标 
和 意图 的 ,并 能 根据 目标 和 环境 要 求 对 短期 行为 做 出 规划 。 

(2) 作用 交互 性 (也 称 反应 性 )。Agent 能 够 与 环境 交互 作用 ,能 够 感知 其 所 处 环境 ， 
并 借助 自己 的 行为 结果 对 环境 做 出 适当 反应 。 

(3) 环境 协调 性 。Agent 存在 于 一 定 的 环境 中 ,感知 环境 的 状态 .事件 和 特征 ,并 通 
过 其 动作 和 行为 影响 环境 ,与 环境 保持 协调 。 环 境 和 Agent 是 对 立 统一 体 的 两 个 方面 ， 
互相 依存 ,互相 作用 。 

(4) 面向 目标 性 。Agent 不 是 对 环境 中 的 事件 做 出 简单 的 反应 , 它 能 够 表现 出 某 种 
目标 指导 下 的 行为 ,为 实现 其 内 在 目标 而 采取 主动 行为 。 这 一 特性 为 面向 Agent 的 程序 
设计 提供 了 重要 基础 。 

(5) 存在 社会 性 。Agent 存在 于 由 多 个 Agent 构成 的 社会 环境 中 ,与 其 他 Agent 交 
换 信 息 、 交 互 作用 和 通信 。 各 Agent 通过 社会 承诺 进行 社会 推理 ,实现 社会 意向 和 目标 。 
Agent 的 存在 及 其 每 一 行为 都 不 是 孤立 的 ,而 是 社会 性 的 ,甚至 表现 出 人 类 社会 的 某 些 
特性 。 

(6) 工作 协作 性 。 各 Agent 合作 和 协调 工作 ,求解 单个 Agent 无 法 处 理 的 问题 ,提高 
处 理 问 题 的 能 力 。 在 协作 过 程 中 可 以 引入 各 种 新 的 机 制 和 算法 。 

(7) 运行 持续 性 。Agent 的 程序 启动 后 ,能 够 在 相当 长 的 一 段 时 间 内 维持 运行 状态 ， 
不 随 运算 的 停止 而 立即 结束 运行 。 

(8) 系统 适应 性 。Agent 不 仅 能 够 感知 环境 ,对 环境 做 出 反应 ,而 且 能 够 把 新 建立 的 
Agent 集成 到 系统 中 ,而 无 须 对 原 有 的 多 Agent 系统 进行 重新 设计 ,因而 具有 很 强 的 适应 
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性 和 可 扩展 性 。 也 可 把 这 一 特点 称 为 开放 性 。 

(9) 结构 分 布 性 。 在 物理 上 或 馆 辑 上 分 布 和 异 构 的 实体 ,如 主动 数据 库 、 知 识 库 \ 控 
制 器 \ 决 策 体 、 感 知 器 和 执行 器 等 ,在 多 Agent 系统 中 具有 分 布 式 结构 ,便于 技术 集成 、 资 
源 共享 ,性 能 优化 和 系统 整合 。 

(10) 功能 智能 性 。Agent 强调 理性 作用 ,可 作为 描述 机 器 智能 、 动 物 智能 和 人 类 智 
能 的 统一 模型 。Agent 的 功能 具有 较 高 智能 ,而 且 这 种 智能 往往 是 构成 社会 智能 的 一 
部 分 。 


6.2.3 Agent 的 结构 特点 


Agent 系统 是 一 个 高 度 开 放 的 智能 系统 ,其 结构 如 何 将 直接 影响 到 系统 的 智能 和 性 
能 。 例 如 ,一 个 在 未 知 环境 中 自主 移动 的 机 器 人 需要 对 它 面 对 的 各 种 复杂 地 形 、 地 貌 、 通 
道 状况 及 环境 信息 做 出 实时 感知 和 决策 ,控制 执行 机 构 完成 各 种 运动 操作 ,实现 导航 、 跟 
踪 .越野 等 功能 ,并 保证 移动 机 器 人 处 于 最 佳 的 运动 状态 。 这 就 要 求 构成 该 移动 机 器 人 系 
统 的 各 个 Agent 有 一 个 合理 和 先进 的 体系 结构 ,保证 各 Agent 自主 地 完成 局 部 问题 求解 
任务 ,显示 出 较 高 的 求解 能 力 , 并 通过 各 Agent 间 的 协作 完成 全 局 任务 。 

人 工 智能 的 任务 就 是 设计 Agent 程序 , 即 实现 Agent 从 感知 到 动作 的 映射 函数 。 这 
种 Agent 程序 需要 在 某 种 称 为 结构 的 计算 设备 上 运行 。 这 种 结构 可 以 是 一 台 普 通 的 计 
算 机 ,或 者 可 能 包含 执行 某 种 任务 的 特定 硬件 ,还 可 能 包括 在 计算 机 和 Agent 程序 间 提 
供 某 种 程度 隔离 的 软件 ,以 便 在 更 高 层次 上 进行 编程 。 一 般 意 义 上 ,体系 结构 使 得 传感器 
的 感知 对 程序 可 用 ,运行 程序 并 把 该 程序 的 作用 选择 反馈 给 执行 器 。 可 见 , Agent、 体 系 
结构 和 程序 之 间 具 有 如 下 关系 。 

Agent 王 体系 结构 十 程序 

计算 机 系统 为 Agent 的 开发 和 运行 提供 软件 和 硬件 环境 支持 ,使 各 个 Agent 依据 全 
局 状态 协调 地 完成 各 项 任务 。 有 具体 地 说 : 

(1) 在 计算 机 系统 中 ,Agent 相当 于 一 个 独立 的 功能 模块 .独立 的 计算 机 应 用 系统 ， 
它 含 有 独立 的 外 部 设备 .输入 输出 驱动 装备 各 种 功能 操作 处 理 程序 .数据 结构 和 相应 的 
输出 。 

(2) Agent 程序 的 核心 部 分 叫做 决策 生成 器 或 问题 求解 器 ,起 主 控 作 用 , 它 接 收 全 局 
状态 ,任务 和 时 序 等 信息 ,指挥 相应 的 功能 操作 程序 模块 工作 ,并 把 内 部 工作 状态 和 所 执 
行 的 重要 结果 送 至 全 局 数据 库 。Agent 的 全 局 数据 库 设 有 存放 Agent 状态 .参数 和 重要 
结果 的 数据 库 , 供 总 体 协调 使 用 。 

(3) Agent 的 运行 是 一 个 或 多 个 进程 ,并 接受 总 体 调度 。 特 别 是 当 系 统 的 工作 状态 
随 工作 环境 经 常 变化 以 及 各 Agent 的 具体 任务 时 常 变更 时 ,更 需 搞 好 总 体 协 调 。 

(4) 各 个 Agent 在 多 个 计算 机 CPU 上 并 行 运行 ,其 运行 环境 由 体系 结构 支持 。 体 系 
结构 还 提供 共享 资源 (黑板 系统 )、Agent 间 的 通信 工具 和 Agent 间 的 总 体 协调 ,以 使 各 
Agent 在 统一 目标 下 并 行 、 协 调 地 工作 。 
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6.2.4 Agent 的 结构 分 类 


根据 上 述 讨论 ,可 把 Agent 看 作 是 从 感知 序列 到 实体 动作 的 映射 。 根 据 人 类 思维 的 
不 同 层次 ,可 把 Agent 分 为 下 列 几 类 。 

(1) 反应 式 Agent。 反 应 式 (reflex 或 reactive) Agent 只 简单 地 对 外 部 刺激 产生 响 
应 ,没有 任何 内 部 状态 。 每 个 Agent 既是 客户 ,又 是 服务 器 ,根据 程序 提出 请 求 或 做 出 回 
答 。 图 6-4 表示 反应 式 Agent 的 结构 了 示意图。 图 中 ,Agent 的 条 件 一 作用 规则 使 感知 和 
动作 连接 起 来 。 我 们 把 这 种 连接 称 为 条 件 一 作用 规则 。 
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图 6-4 反应 式 Agent 结构 


(2) 慎 思 式 Agent。 慎 思 式 (deliberative) Agent 又 称 为 认 知 式 (cognitive) Agent, 是 
一 个 具有 显 式 符 号 模型 的 基于 知识 的 系统 。 其 环境 模型 一 般 是 预先 知道 的 ,因而 对 动态 
环境 存在 一 定 的 局 限 性 ,不 适用 于 未 知 环境 。 由 于 缺乏 必要 的 知识 资源 ,在 Agent 执行 
时 需要 向 模型 提供 有 关 环 境 的 新 信息 ,而 这 往往 是 难以 实现 的 。 

慎 思 式 Agent 的 结构 如 图 6-5 所 示 。Agent 接收 的 外 部 环境 信息 依据 内 部 状态 进行 
信息 融合 ,以 产生 修改 当前 状态 的 描述 。 然 后 ,在 知识 库 支持 下 制订 规划 ,再 在 目标 指引 
下 形成 动作 序列 ,对 环境 产生 影响 。 
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图 6-5 慎 思 式 Agent 结构 


(3) 跟踪 式 Agent。 简 单 的 反应 式 Agent 只 有 在 现 有 感知 的 基础 上 ,才能 做 出 正确 
的 决策 。 随 时 更 新 内 部 状态 信息 要 求 把 两 种 知识 编 人 Agent 的 程序 , 即 关 于 世界 如 何 独 
立地 发 展 Agent 的 信息 以 及 Agent 自身 作用 如 何 影响 世界 的 信息 。 图 6-6 给 出 一 种 具有 
内 部 状态 的 反应 式 Agent 的 结构 图 ,表示 现 有 的 感知 信息 如 何 与 原 有 的 内 部 状态 相 结 
合 ,以 产生 现 有 状态 的 更 新 描述 。 与 解释 状态 的 现 有 知识 的 新 感知 一 样 ,也 采用 了 有 关 世 
界 如 何 跟踪 其 未 知 部 分 的 信息 ,还 必须 知道 Agent 对 世界 状态 有 哪些 作用 。 具 有 内 部 状 
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态 的 反应 式 Agent 通过 找到 一 个 条 件 与 现 有 环境 匹配 的 规则 进行 工作 ,然后 执行 与 规则 
相关 的 作用 。 这 种 结构 叫 作 跟踪 世界 Agent 或 跟踪 式 Agent。 
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图 6-6 具有 内 部 状态 的 Agent 结构 


(4) 基于 目标 的 Agent。 仅 了 解 现 有 状态 对 决策 来 说 往往 是 不 够 的 ,Agent 还 需要 某 
种 描述 环境 情况 的 目标 信息 。Agent 的 程序 能 够 与 可 能 的 作用 结果 信息 结合 起 来 ,以 便 
选择 达到 目标 的 行为 。 这 类 Agent 的 决策 基本 上 与 前 面 所 述 的 条 件 一 作用 规则 不 同 。 
反应 式 Agent 中 有 的 信息 没有 明确 使 用 ,而 设计 者 已 预先 计算 好 各 种 正确 作用 。 对 于 反 
应 式 Agent, 还 必须 重 写 大 量 的 条 件 一 作用 规则 。 基 于 目标 的 Agent 在 实现 目标 方面 更 
灵活 ,只 要 指定 新 的 目标 ,就 能 够 产生 新 的 作用 。 图 6-7 表示 基于 目标 的 Agent 结构 。 








Agent 





Agent | | 世界 发 展 有 内 
影响 世界 | | Agent | | 原 基 部 
目标 信息 信息 和 


| | “3 | 


作用 决策 | 一 | 作用 对 世界 的 影响 | 一 一 | 世界 现状 
| | | | 
执行 器 一 | 环境 传感器 




































































图 6-7 基于 目标 的 Agent 结构 


(5) 基于 效果 的 Agent。 只 有 目标 实际 上 还 不 足以 产生 高 质量 的 作用 。 如 果 一 个 世 
界 状 态 优 于 另 一 个 世界 状态 ,那么 它 对 Agent 就 有 更 好 的 效果 (utility)。 因 此 ,效果 是 一 
种 把 状态 映射 到 实数 的 函数 ,该 函数 描述 了 相关 的 满意 程度 。 一 个 完整 规范 的 效果 函数 
允许 对 两 类 情况 做 出 理性 的 决策 。 第 一 , 当 Agent 只 有 一 些 目标 可 以 实现 时 ,效果 函数 
指定 合适 的 交 蔡 。 第 二 , 当 Agent 存在 多 个 瞄准 目标 而 不 知 哪 一 个 一 定 能 够 实现 时 , 效 
果 函 数 提供 了 一 种 根据 目标 的 重要 性 估计 成 功 可 能 性 的 方法 。 因 此 ,一 个 具有 显 式 效果 
函数 的 Agent 能 够 做 出 理性 的 决策 。 不 过 ,必须 比较 由 不 同 作用 获得 的 效果 。 图 6-8 给 
出 一 个 完整 的 基于 效果 的 Agent 结构 。 








246 人 工 者 能 ( 荔 3 虎 ) 












































作用 |_| 满意 | | ee rs 
[ 长 玫 | 各 二 作用 对 世界 的 影响 一 | 





























图 6-8 基于 效果 的 Agent 结构 


(6) 复合 式 Agent。 复 合式 Agent 即 在 一 个 Agent 内 组 合 多 种 相对 独立 和 并 行 执行 
的 智能 形态 ,其 结构 包括 感知 器 ,反射 、 建 模 、 规 划 、 通 信 、 决 策 生成 和 执行 器 等 模块 ,如 图 
6-9 所 示 。Agent 通过 感知 模块 反映 现实 世界 ,并 对 环境 信息 做 出 一 个 抽象 ,再 送 到 不 同 
的 处 理 模块 。 若 感知 到 简单 或 紧急 情况 ,信息 就 被 送 入 反射 模块 ,做 出 决定 ,并 把 动作 命 
令 送 到 行动 模块 ,产生 相应 的 动作 。 
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图 6-9 复合 式 Agent 结构 


6.3 Agent 应 用 案例 


下 面 给 出 一 些 Agent 例子 ,以 加 强 对 Agent 概念 的 理解 ,分 析 其 性 质 和 特征 。 在 面 
向 Agent 的 软件 开发 过 程 中 ,软件 开发 人 员 应 该 将 现实 世界 应 用 系统 和 计算 机 世界 软件 
系统 中 的 哪些 实体 视 为 Agent 呢 ? 从 软件 工程 的 角度 ,系统 中 的 任何 行为 实体 都 可 抽象 
地 将 它 视 为 Agent, 只 要 这 种 抽象 有 助 于 分 析 、 规 约 、 设 计 和 实现 软件 系统 。 

例 6.1 物理 Agent。 

现实 世界 中 的 任何 控制 系统 都 可 视 为 Agent。 例 如 ,房间 恒温 调控 系统 中 的 恒温 调 
节 器 就 是 一 个 Agent, 如 图 6-10 所 示 。 

恒温 调节 器 Agent 的 设计 目标 是 要 将 房间 的 温度 维持 在 用 户 设 定 的 范围 。 它 驻 留 
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恒温 调节 器 


环境 


于 物理 环境 (房间 ) 中 ,具有 温度 感应 器 以 感知 环境 输入 
(房间 中 的 温度 ) ,并 能 对 感知 到 的 房间 温度 做 出 适时 反 
应 ,通过 与 空调 设施 (实际 上 ,我 们 也 可 将 它 视 为 一 个 
Agent) 进 行 交互 ,从 而 影响 所 处 的 环境 ( 调 高 或 者 降低 房 
间 的 温度 ) 。 

当 人 恒温 调节 器 Agent 感知 到 房间 的 温度 低 于 用 户 设 
定 值 , 就 向 空调 设施 发 出 信号 要 求 加 大 热 空气 的 流量 , 空 
调 设施 一 旦 接收 到 该 信号 ,将 加 大 输出 的 热 空气 流量 ,从 ”图 6-10 恒温 调节 器 是 Agent 
而 使 得 房间 的 温度 升 高 ; 如 果 房 间 的 温度 高 于 用 户 设 定 
值 , 则 向 空调 设施 发 出 信号 要 求 加 大 冷 空气 的 流量 ,空调 设施 一 旦 接收 到 该 信号 ,将 加 大 
冷 空气 流量 ,从 而 使 得 房间 的 温度 降低 。 因 此 ,向 空调 设施 发 送 各 种 信和 号 一 方面 体现 了 便 
温 调 节 器 Agent 与 环境 中 其 他 Agent( 空 调 设施 ) 之 间 的 交互 , 另 一 方面 也 展示 了 人 恒温 调 
节 器 Agent 具有 的 能 力 。 正 是 通过 该 能 力 ,恒温 调节 器 Agent 在 感知 到 环境 温度 后 , 自 
主 地 决定 和 执行 不 同 的 动作 ,从 而 保证 房间 的 温度 维持 在 用 户 设 定 的 范围 。 

在 该 例子 中 ,恒温 调节 器 Agent 的 行为 灵活 性 主要 体现 在 对 感知 输入 的 适时 反应 ， 
根据 其 设计 目标 ,恒温 调节 器 Agent 无 须 自发 性 的 行为 。 

现实 世界 中 的 Agent 是 一 个 个 的 物理 部 件 , Agent 展示 的 能 力主 要 体现 为 物理 
Agent 所 拥有 的 物理 动作 ,其 驻 留 的 环境 是 物理 环境 。 

例 6.2 软件 Agent。 

可 将 大 多 数 软件 Demon 视 为 Agent, 它们 作为 后 台 进 程 持续 地 运行 于 计算 机 系统 
中 ,不 断 监控 计算 机 系统 中 的 信息 ,并 通过 执行 动作 影响 系统 环境 。 

例如 ,杀毒 软件 中 的 文件 实时 防护 子 系统 可 视 为 软件 Agent。 文 件 实时 防护 软件 
Agent 的 设计 目标 是 要 保护 计算 机 系统 中 的 文件 系统 ,防止 系统 中 的 文件 被 病毒 感染 
以 及 由 此 而 导致 的 进一步 传播 。 因 此 ,文件 实时 防护 Agent 需 持 续 不 断 地 运行 于 用 户 
的 计算 机 中 ,通过 与 软件 环境 (如 操作 系统 文件 系统 .图 形 用 户 界面 等 ) 的 交互 ,感知 
用 户 计算 机 文件 系统 的 变化 ,如 增加 一 个 新 的 文件 .从 其 他 媒介 中 复制 一 个 文件 .已 有 
文件 中 的 数据 被 修改 等 。 根 据 感 知 到 的 信息 ,文件 实时 防护 Agent 将 自主 地 对 可 疑 的 
文件 进行 处 理 , 如 病毒 扫描 和 分 析 、 病 毒 清除 文件 隔离 .文件 删除 .文件 备份 等 ,并 通 
过 图 形 用 户 界 面 及 时 地 将 相关 信息 通告 给 用 户 。 在 该 例子 中 ,文件 实时 防护 软件 
Agent 的 行为 灵活 性 不 仅 体现 在 反应 性 方面 ,而 且 还 体现 出 一 定 的 自发 性 (如 主动 对 受 
病毒 感染 的 文件 进行 备份 ) 。 

杀毒 软件 中 的 病毒 数据 维护 子 系统 也 可 视 为 软件 Agent。 病 毒 数 据 维护 软件 Agent 
的 设计 目标 是 要 确保 用 户 计算 机 中 的 病毒 数据 得 到 及 时 的 更 新 和 维护 。 当 用 户 的 计算 机 
开启 时 ,病毒 数据 维护 软件 Agent 就 被 加 载 , 并 在 用 户 计 算 机 中 持续 不 断 地 运行 。 病 毒 
数据 维护 软件 Agent 拥有 用 户 本 地 计算 机 系统 中 的 病毒 数据 。 如果 用 户 的 计算 机 与 
Internet 连接 ,病毒 数据 维护 软件 Agent 能 通过 与 远 端 病毒 数据 服务 器 的 交互 ,感知 环境 
输入 (体现 为 远 端 服务 器 中 病毒 数据 的 变化 ) ,判断 用 户 计算 机 中 的 病毒 数据 是 否 需 要 更 
新 。 如 果 需 要 ,病毒 数据 维护 Agent 将 通过 与 远 端 数据 服务 器 的 交互 ,自发 地 从 远 端 数 
据 服务 器 中 下 载 最 新 的 病毒 数据 。 
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不 同 于 例 6.1, 例 6.2 中 给 出 的 软件 Agent 对 应 的 是 一 个 个 软件 逻辑 部 件 , Agent 展 
现 的 能 力主 要 表现 为 由 语句 序列 构成 的 一 系列 计算 机 操作 指令 ,而 不 是 物理 动作 ,软件 
Agent 所 驻 留 的 环境 一 般 是 逻辑 (软件 ) 环 境 。 

例 6.3 个 人 数字 助手 。 

代表 用 户 利益 ,负责 为 用 户 提供 各 种 通信 、 信 息 、 购 物 .日 程 安排 等 服务 的 个 人 数字 助 
手 可 视 为 Agent。 

个 人 数字 助手 Agent 驻 留 在 Internet 环境 中 ,通过 与 用 户 的 多 次 交互 以 及 对 用 户 日 
常 访问 网 站 及 其 信息 类 型 的 分 析 和 学 习 , 个 人 数字 助手 Agent 逐渐 了 解 用 户 的 习性 和 爱 
好 。 例 如 ,喜欢 访问 哪些 网 站 .喜欢 哪些 类 型 的 信息 。 于 是 ,每 天 个 人 数字 助手 Agent 都 
会 通过 Internet 自发 地 帮助 用 户 搜索 和 收集 大 量 的 、 用 户 关心 的 信息 ,并 对 收集 到 的 信息 
进行 过 滤 和 整理 ,供用 户 阅 读 和 浏览 。 

如 果 某 天 个 人 数字 助手 Agent 帮助 用 户 接 收 到 一 个 来 自 某 个 国际 会 议程 序 委 员 会 
的 邮件 ,通知 他 所 投 的 论文 已 经 录用 ,并 邀请 其 参加 某 个 时 间 在 某 地 举行 的 国际 学 术 会 
议 。 个 人 数字 助手 Agent 将 根据 这 些 信息 自发 地 为 用 户 制定 一 个 参加 会 议 的 日 程 时 刻 
表 , 并 为 用 户 的 旅行 路 线 和 航班 安排 提供 一 个 详细 的 计划 ,供用 户 参考 。 一 旦 用 户 认可 个 
人 数字 助手 Agent 制订 的 旅行 计划 ,那么 它 将 通过 Internet 与 远 端 多 家 航空 公司 的 机 票 
定购 软件 Agent 进行 交互 ,就 机 票 的 价格 进行 协商 ,以 帮助 用 户 争 取 到 价格 实惠 但 同时 
又 不 影响 其 旅程 的 机 票 ,并 通过 与 航空 公司 机 票 定 购 软 件 Agent 的 合作 ,帮助 用 户 预 订 
机 票 。 一 旦 机 票 定购 成 功 ,个 人 数字 助手 Agent 将 根据 航空 公司 机 票 定购 软件 Agent 提 
供 的 信息 提醒 用 户 必须 在 某 个 时 候 进行 机 票 确认 。 

例 6.4 机 器 人 。 

可 以 将 开放 环境 下 为 人 类 提供 各 种 服务 (如 家 庭 服 务 . 人 道 主 义 救 援 .排除 炸弹 等 ) 的 
机 器 人 视 为 Agent。 在 开放 环境 下 的 机 器 人 通常 被 赋予 各 种 各 样 的 任务 和 目标 ,以 为 人 
类 服务 ,它们 需要 通过 各 种 传 感 设施 (如 视觉 ,雷达 ,红外 等 ) 感 知 所 在 环境 的 信息 ,并 通过 
相应 的 处 理 形成 感知 输入 ,建立 起 环境 模型 。 例 如 ,机 器 人 通过 雷达 或 者 红外 探测 其 运行 
前 方 是 否 有 障碍 物 。 基 于 其 任务 ,机 器 人 需要 展示 目标 制导 的 行为 , 即 机 器 人 根据 其 被 赋 
予 的 目标 自主 地 选择 和 执行 动作 ,从 而 达成 任务 的 实现 。 开 放 环境 下 的 机 器 人 通常 需要 
有 具备 不 同 程度 的 灵活 性 。 例 如 , 它 必 须 具备 反应 性 ,以 对 感知 到 的 环境 信息 (如 前 方 的 障 
碍 物 ) 进 行 及 时 处 理 ; 在 某 些 情况 下 , 它 还 需 具 备 一 定 程度 的 主动 性 ,自发 地 产生 目标 ,从 
而 更 好 地 为 人 类 服务 。 此 外 ,在 多 机 器 人 的 场景 下 ,不同 机 器 人 之 间 还 必须 进行 交互 和 协 
同 ,从 而 展示 其 社会 性 。 现 实 世 界 中 的 Agent 是 一 个 个 的 物理 部 件 ,Agent 展示 的 能 力主 
要 体现 为 物理 Agent 所 拥有 的 物理 动作 ,其 所 驻 留 的 环境 是 物理 环境 。 

目前 ,多 Agent 系统 技术 已 经 广泛 应 用 于 诸多 领域 .并 取得 了 一 些 成 功 的 应 用 。 

(1) 航空 航天 。 该 领域 的 应 用 大 多 需要 解决 开放 ,不 可 知 和 不 确定 的 环境 (如 外 太 
空 ) 以 及 由 此 给 计算 机 软件 带 来 的 自主 性 、 反 应 性 、 适 应 性 等 方面 的 问题 。 例 如 ,开发 
太空 机 器 人 开展 星球 (如 月 球 、 火 星 ) 表 面 的 探索 ,或 者 开发 具有 自主 行为 的 无 人 飞行 
器 等 。 

(2) 国防 军事 。 当 前 军事 技术 越 来 越 多 地 朝 无 人 化 、 自 主 化 智能 化 等 方向 发 展 , 需 
要 大 量 的 信息 系统 和 智能 系统 快速 应 对 战场 环境 的 变化 ,并 提供 指挥 ,决策 、 情 报 、 安 全 、 
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监视 等 方面 的 功能 。Agent 和 多 Agent 系统 在 军事 领域 的 应 用 小 到 嵌入 物理 武器 装备 中 
的 Agent 或 者 军用 笔记 本 . 单 兵 系统 中 的 个 人 数字 助手 ,大 到 复杂 的 作战 仿真 系统 、 一 体 
化 指挥 平台 等 。 

(3) 电子 商务 。 电 子 商 务 系统 通常 部 署 在 开放 的 互联 网 环境 中 ,需要 处 理 动态 的 商 
业 事务 ,适应 持续 变化 的 环境 和 商业 需求 ,帮助 用 户 查询 各 种 信息 ,满足 不 同 用 户 的 个 性 
化 需要 。 电 子 商务 的 应 用 包括 信息 查询 和 过 滤 、 个 人 数字 助手 、 网 上 商店 、 交 易 处 理 、 拍 卖 
和 协商 ,业务 集 成 等 。 

(4) 能 源 与 电力 。 能 源 网 络 建立 在 大 量 的 能 源 生产 者 (如 家 庭 太阳 能 ) 、 消 费 者 (如 路 
灯 、 家 庭 , 甚 至 某 个 智能 家 居 等 ) 基 础 之 上 ,它们 需要 采用 发 散 的 方式 进行 管理 ,并 需要 通 
过 不 同形 式 的 协同 达成 能 源 的 综合 利用 。 能 源 系 统 需 要 具备 很 强 的 灵活 性 、 适 应 性 ,能 够 
快速 应 对 能 源 需 求 和 供应 的 变化 。 其 应 用 包括 电力 资源 的 发 散 式 管理 能 源 拍卖 和 购置 、 

(5) 健康 服务 。 健 康 服务 (health care) 是 一 个 用 户 要 求 日 趋 增长 的 巨大 市 场 。 尤 其 
是 随 着 人 口 老龄 化 的 不 断 增长 .各 种 疾病 的 出 现 以 及 政府 、 社 会 .组 织 和 公民 对 健康 护理 
的 日 益 重视 ,如 何 提供 友好 .个 性 化 ,快速 .便捷 和 安全 的 服务 成 为 这 一 领域 面临 的 一 项 重 
大 挑战 。 健 康 服务 涉及 大 量 ,扮演 不 同 角色 和 承担 不 同 职责 、 需 要 相互 交互 和 协同 的 个 体 
(如 病人 、 护 士 .医生 、 家 属 、 护 理 人 员 等 ) ,同时 跨越 多 个 不 同 的 部 门 和 信息 系统 ,需要 与 大 
量 的 物理 系统 (如 医疗 设备 、 穿 戴 式 设备 等 ) 进 行 交互 ,满足 不 同 个 体 的 个 性 化 要 求 。 其 应 
用 包括 健康 状况 监控 ,个 性 化 护理 服务 .主动 服务 .信息 共享 和 交换 等 。 

(6) 机 器 人 。 机 器 人 不 但 可 以 应 用 于 工业 生产 .无 人 系统 等 领域 ,而 且 可 以 帮助 人 们 
做 家 庭 事务 、 健 康 护理 等 工作 。 单 个 机 器 人 就 是 一 个 典型 的 Agent, 它 能 感知 环境 变化 ， 
并 能 自主 地 实施 行为 完成 设计 目标 。 机 器 人 将 需要 更 多 地 开展 协同 工作 ,并 与 物理 系统 
(如 医疗 传 感 设备 ) 和 信息 系统 (如 病人 救护 系统 ) 紧 密 地 结合 在 一 起 开展 工作 。 

(7) 生产 制造 与 物流 。 现 代 化 的 工业 生产 和 制造 需要 解决 高 度 自动 化 问题 ,包括 规 
划 、 生 产 、 监 视 、 协 调 等 。 生 产 出 来 的 产品 期 望 能 够 尽快 、 高 效 、 低 成 本 地 进入 流通 环节 , 因 
而 需要 对 物流 的 产品 及 其 状况 进行 有 效 的 分 析 、 优 化 ,监控 等 ,尤其 需要 跨 机 构 和 部 门 的 
自主 协调 能 力 以 及 对 各 种 异常 情况 进行 自主 管理 的 能 力 。 

(8) 安全 与 监视 。 在 互联 网 和 移动 互联 网 时 代 , 大 量 非法 的 访问 、 侵 入 、 植 入 、 盗 取 等 
行为 极 大 地 损害 了 用 户 的 个 人 隐私 ,甚至 给 用 户 造成 损失 ,因此 该 领域 应 用 需要 Agent 
和 多 Agent 系统 技术 以 感知 和 监控 环境 及 自身 的 状况 ,并 根据 监控 到 的 信息 自主 地 实施 
诸如 隔离 .拒绝 .保护 等 措施 。 其 应 用 包括 防 木 马 程序 .病毒 检测 和 清除 等 。 

(9) 电信 。 电 信 应 用 涉及 大 量 的 用 户 和 事务 ,需要 处 理 大 量 的 动态 信息 以 及 进行 各 
种 形式 的 优化 ,同时 为 用 户 提供 友好 和 个 性 化 的 服务 。 

(10) 交通 运输 。 交 通 运 输 领 域 涉及 大 量 的 自主 个 体 ( 如 车 辆 .驾驶 人 员 、 管 理 和 管制 
人 员 等 ), 需 要 与 大 量 的 设施 (如 信号 灯 ) 进 行 交互 ,这 类 系统 对 全 局 优化 、 高 效 运行、 自主 
管理 等 提出 了 很 高 的 要 求 。 其 应 用 包括 空中 交通 管制 信号灯 管理 和 优化 、 运 输 车 辆 的 调 
度 和 自 组 织 、 自 主 驾 驶 车 辆 等 。 
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6.4 Agent 通信 


6.4.1 通信 方式 


用 多 Agent 系统 进行 分 布 式 问题 求解 ,集成 在 一 个 系统 中 的 Agent 必须 彼此 能 通信 
和 协作 。 通 信 是 协作 的 基础 。 通 信和 方法 可 以 分 成 黑板 系统 、 消 息 传送 .邮箱 3 种 方式 。 

1. 黑板 系统 

黑板 系统 是 传统 的 人 工 智能 系统 和 专家 系统 的 议事 日 程 的 扩充 ,通过 使 用 合适 的 结 
构 支持 分 布 式 问题 求解 。 在 多 Agent 系统 中 ,黑板 提供 公共 工作 区 , Agent 可 以 交换 信 
息 .数据 和 知识 。 开 始 一 个 Agent 在 黑板 写 入 信息 项 ,然后 可 为 系统 中 的 其 他 Agent 使 
用 。Agent 可 以 在 任何 时 候 访 问 黑板 ,看 看 有 没有 新 的 信息 到 来 。 它 并 不 需要 阅读 所 有 
信息 ,可 以 采用 过 滤器 抽取 当前 工作 所 需 的 信息 。Agent 必须 在 访问 授权 中 心 站 点 登录 。 
在 黑板 系统 中 ,Agent 间 不 发 生 直 接 通 信 。 每 个 Agent 独立 地 完成 它们 答应 求解 的 子 
问题 。 

黑板 可 以 用 在 任务 共享 和 结果 共享 系统 中 。 基 于 事件 的 问题 求解 策略 也 是 可 能 的 。 
如 果 系 统 中 Agent 很 多 ,那么 黑板 中 的 数据 会 呈 指 数 增加 。 与 此 类 似 , 各 个 Agent 在 访 
问 黑板 时 要 从 大 量 信息 中 搜索 ,决定 感 兴趣 的 信息 。 为 了 优化 处 理 , 更 先进 的 黑板 概念 是 
在 黑板 上 为 各 个 Agent 提供 不 同 的 区 域 。 

2. 消息 传送 

采用 消息 通信 是 实现 灵活 复杂 的 协调 策略 的 基础 。 使 用 规定 的 协议 ,Agent 彼此 交 
换 的 消息 可 以 用 来 建立 通信 和 协作 机 制 。 自 由 消息 内 容 格 式 提供 非常 灵活 的 通信 能 力 ， 
不 受 简单 命令 和 响应 结构 的 限制 。 图 6-11 说 明了 面向 消息 的 Agent 系统 的 原理 。 


Agent A( 发 送 者 ) Lt Agent B( 接 收 者 ) 


图 6-11 面向 消息 的 Agent 系统 的 原理 











图 6-11 中 ,一 个 Agent 叫 发 送 者 ,传送 特定 的 消息 到 另 一 个 Agent, 即 接收 者 。 与 黑 
板 系统 不 同 , 两 个 Agent 间 的 消息 是 直接 交换 。 执 行 中 没有 缓冲 ,如 果 不 是 发 送 给 它 的 
话 , 它 是 不 能 读 消息 的 。 所 谓 广播 ,是 一 种 特例 ,消息 是 发 给 每 个 Agent 或 一 个 组 。 一 般 
情况 下 ,发 送 者 要 指定 唯一 的 地 址 给 消息 ,然后 只 有 那个 地 址 的 Agent 才能 读 这 条 消息 。 
为 了 支持 协作 策略 ,通信 协议 必须 明确 规定 通信 过 程 、 消 息 格 式 和 选择 通信 语言 。 另 一 点 
特别 重要 的 是 交换 知识 ,全 部 有 关 的 Agent 必须 知道 通信 语言 的 语义 。 消 息 的 语义 内 容 
知识 是 分 布 式 问题 求解 的 核心 部 分 。 

3. 邮箱 

在 邮箱 通信 方式 中 ,参与 通信 的 Agent 都 有 自己 的 邮箱 并 且 它 们 之 间 需 要 建立 起 邮 
件 通道 。 一 般 情 况 下 ,这 些 邮 件 通道 可 以 为 多 个 Agent 之 间 的 消息 传输 所 共有 ,而 不 是 
由 某 些 Agent 独占 。 一 个 Agent 欲 向 另 一 个 Agent 发 送 消息 时 , 它 可 以 将 消息 打包 成 邮 
件 , 并 通过 邮件 通道 发 送 到 目标 方 Agent 的 邮箱 中 。 目 标 方 Agent 可 以 定期 或 者 不 定期 
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地 访问 它 的 邮箱 ,如 果 邮 箱 中 有 邮件 , 它 将 可 以 取出 邮件 并 对 其 进行 处 理 。 这 种 交互 方式 
与 人 类 社会 中 的 基于 信件 交互 以 及 在 互联 网 空间 的 电子 邮件 交互 很 类 似 。 由 于 邮件 通道 
是 非 独 占 性 的 ,多 个 Agent 的 邮件 可 以 共享 利用 ,因而 相对 于 消息 传递 通信 方式 而 言 , 邮 
箱 通信 方式 的 保密 性 并 不 是 很 好 。 此 外 ,邮箱 通信 一 般 采 用 异步 方式 ,邮件 所 走 的 通道 及 
其 所 需 的 时 间 不 确定 ,因而 该 通信 方式 的 实时 性 较 差 。 

Agent 通信 语言 的 理论 基础 是 基于 言语 行为 (speech act) 理 论 。 这 种 理论 由 英国 哲 
学 家 和 语言 学 家 Austin 提出 ,并 由 Searle, Cohen 等 学 者 加 以 发 展 。 言语 行为 理论 的 主 
要 原理 认为 : 通信 语言 也 是 一 种 动作 ,它们 和 物理 上 的 动作 一 样 。 发 言 人 说 话 是 为 了 使 
世界 的 状态 发 生 改 变 ,通常 是 改变 听众 的 某 种 心智 状态 。 通 信 语 言 并 不 一 定 可 以 达到 它 
的 预期 目的 。 这 是 因为 每 个 Agent 都 有 对 它 自身 的 控制 权 , 它 不 一 定 按说 话 人 要 求 的 那 
样 做 出 响应 。 

有 关 言 语 行为 理论 的 研究 主要 集中 在 如 何 划分 不 同类 型 的 言语 行为 。 在 Agent 通 
信 语 言 的 研究 中 ,言语 行为 理论 也 主要 用 来 考虑 Agent 之 间 可 以 交互 的 信息 类 型 。 一 种 
最 通用 的 分 类 方式 是 将 言语 行为 分 为 表示 型 (representative) (如 通知 、 致 谢 、 宣 告 等 ) 和 
指示 型 (directive) (如 请 求 ,询问 等 )。 如 果 更 进一步 区 分 ,还 可 以 分 成 如 下 类 型 。 























类 型 本 时 于 
断言 型 (assertive) 电视 机 是 关 着 的 
指示 型 (directive) 把 电视 机 关 掉 
承诺 型 (commisive) 我 会 关 掉 电视 机 的 
允许 型 (permisive) 你 可 以 把 电视 机 关 掉 
禁止 型 (prohibitive) 你 不 能 把 电视 机 关 掉 
声明 型 (declarative) 我 宣布 这 个 电视 机 归 我 所 有 


这 种 划分 依然 很 粗糙 。 例 如 ,指示 型 中 还 可 以 再 划分 成 命令 .协议 .请求 .建议 等 。 
6.4.2 Agent 通信 语言 ACL 


在 多 Agent 系统 中 ,为 了 实现 Agent 之 间 的 交互 和 协同 ,参与 交互 的 Agent 需要 某 
种 特定 的 语言 准确 地 表达 其 交互 的 意图 和 内 容 , 并 且 接 收 方 Agent 能 够 根据 该 语言 表达 
的 信息 正确 地 理解 相关 方 Agent 的 协同 目的 ,从 而 实施 相应 的 行为 。Agent 通信 语言 是 
一 种 用 于 表达 Agent 间 交 互 消息 的 描述 性 语言 。 它 定义 了 交互 消息 的 格式 ( 即 语法 ) 和 
内 涵 ( 即 语义 ) ,支持 参与 交互 的 Agent 对 这 些 消 息 进行 理解 和 分 析 。 一 般 地 ,Agent 通信 
语言 至 少 应 具备 以 下 两 方面 的 表达 能 力 。 

1. 交互 和 协同 的 意图 

在 多 Agent 系统 中 ,协同 是 Agent 间 的 一 个 复杂 过 程 。 这 一 过 程 涉 及 诸多 Agent 以 
及 发 生 在 它们 之 间 的 一 系列 交互 ,每 一 次 交互 都 展示 了 参与 交互 Agent 的 不 同 协同 意 
图 ,从 而 引发 相关 的 Agent 实施 相应 的 行为 。 因 此 ,Agent 通信 语言 应 提供 表达 Agent 
交互 意图 的 语言 设施 和 结构 。 例 如 ,在 协同 过 程 中 , Agent 的 某 次 交互 是 要 请 求 对 方 
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Agent 提供 某 项 服务 ,还 是 向 对 方 提出 一 项 建议 ,是 要 做 出 一 项 服务 承诺 ,还 是 要 向 目标 
Agent 提供 某 种 信息 。 显 然 , 这 些 交 互 意 图 的 表述 对 于 参与 交互 的 Agent 正确 地 表达 和 
理解 交互 的 意图 、 提 供 理性 的 行为 有 序 地 开展 协同 活动 是 极为 重要 的 。 

2. 交互 和 协同 的 内 容 

除了 交互 意图 之 外 ,Agent 间 的 交互 还 涉及 协同 内 容 问 题 。 也 就 是 说 ,要 针对 哪些 
方面 开展 协同 。 例 如 ,一 个 Agent 请 求 另 一 个 Agent 为 它 提供 某 种 服务 ,那么 它 希望 获 
得 什么 样 的 服务 ;如 果 一 个 Agent 告知 另 一 个 Agent 某 项 信息 ,该 信息 到 底 是 什么 ;如 
果 某 个 Agent 向 另 一 个 Agent 做 出 某 项 承诺 ,该 承诺 是 什么 。 显 然 ,Agent 通信 语言 需 
要 提供 某 种 手段 准确 地 表达 交互 的 内 容 , 以 便 接收 方 Agent 能 够 正确 地 理解 交互 的 
内 容 。 

概括 地 讲 ,Agent 通信 语言 是 一 种 用 于 表达 Agent 交互 意图 的 语言 。 不 同 于 程序 设 
计 语言 (如 Java.C++ ,Python、PROLOG 等 ),Agent 通信 语言 具有 以 下 4 个 特点 。 

(1) Agent 通信 语言 的 使 用 对 象 是 Agent。 多 Agent 系统 中 的 各 个 Agent 使 用 
Agent 通信 语言 表达 交互 和 协同 的 意图 和 内 容 , 因 此 Agent 通信 语言 的 使 用 者 是 Agent。 
在 运行 阶段 ,Agent 根据 协同 需要 组 装 和 形成 交互 消息 ,接收 方 Agent 对 接收 到 的 消息 进 
行 分 析 和 人 处理 。 

(2) Agent 通信 语言 是 一 种 用 于 表示 交互 意图 和 内 容 的 描述 性 语言 。Agent 通信 语 
言 专门 用 于 刻画 Agent 间 交 互 的 意图 和 内 容 , 并 使 得 参与 交互 的 其 他 Agent 能 够 理解 这 
些 信息 ,进而 支持 Agent 之 间 的 协同 。 

(3) Agent 通信 语言 具有 严格 的 语法 、 语 义 和 语 用 。 语 法 是 指 Agent 通信 语言 的 构 
成 和 结构 ,如 符号 如 何 构成 ,有 哪些 保留 符号 ,这 些 符号 如 何 形成 一 个 合法 的 消息 等 。 语 
义 是 指 交互 的 内 容 , 用 于 解释 交互 消息 中 各 种 符号 的 指称 ,如 消息 中 的 符号 Book 指称 问 
题 域 中 的 什么 对 象 。 语 用 是 指 交互 的 意图 ,如 一 个 Agent 向 另 一 个 Agent 发 送 消息 要 求 
获得 某 项 服务 ,因而 该 消息 表达 的 语 用 是 一 种 服务 请 求 , 它 将 影响 消息 接收 方 Agent 的 
任务 和 意图 ,如 果 消 息 接收 方 Agent 同意 提供 相应 的 服务 ,那么 它 将 会 生成 一 个 新 的 任 
务 , 产 生 一 项 新 的 意图 。 在 多 Agent 系统 的 构造 和 运行 过 程 中 , Agent 需要 根据 Agent 
通信 语言 的 语法 .语义 和 语 用 组 装 .形成 、 理 解 交 互 行为 。 

(4) Agent 通信 语言 独立 于 具体 的 实现 技术 和 运行 平台 。 由 于 Agent 通信 语言 用 于 
表达 交互 的 意图 和 内 容 , 它 通常 与 多 Agent 系统 的 具体 实现 技术 和 运行 平台 没有 太 多 的 
相关 性 。 例 如 ,Agent 通信 语言 不 考虑 Agent 的 实现 体系 结构 ,也 不 考虑 Agent 在 什么 
样 的 平台 上 运行 。 

为 了 支持 多 Agent 系统 的 开发 ,目前 人 们 已 经 提出 了 多 种 Agent 通信 语言 ,比较 有 
代表 性 和 有 影响 力 的 主要 有 以 下 两 种 : 一 种 是 由 美国 国防 部 的 高 级 计划 署 主持 研发 的 知 
识 查询 与 操纵 语言 (Knowledge Query and Manipulation Language,KQML) ; 另 一 种 是 由 
智能 物理 Agent 基金 (Foundation for Intelligent Physical Agents,FIPA) 提 出 的 Agent 
通信 语言 (Agent Communication Language, ACL)。 

FIPA 是 一 家 专门 致力 于 推动 Agent 技术 标准 化 及 其 应 用 的 非 营利 组 织 , 其 目标 是 
要 通过 制定 国际 上 公认 的 一 组 Agent 技术 规范 最 大 限度 地 确保 多 个 Agent 系统 之 间 的 
互 操作 。 至 今 ,FIPA 已 经 提出 了 多 个 Agent 技术 规范 ,其 中 Agent 通信 语言 是 FIPA 着 
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注 和 重视 的 标准 化 内 容 之 一 。FIPA 提出 的 ACLAgent 通信 语言 定义 了 Agent 之 间 
交互 的 一 组 消息 类 型 ,对 这 些 交互 消息 的 语法 、 语 义 和 语 用 做 出 了 严格 、 形 式 化 的 描述 和 
定义 。 在 此 基础 上 ,FIPA ACL 还 提出 了 一 组 高 层 的 交互 协议 ,以 支持 Agent 之 间 的 复 
杂 协 同 。 

FIPA ACL 的 语法 定义 如 图 6-12 所 示 。 一 个 FIPA ACL 消息 由 通信 行为 .通信 内 容 
以 及 一 组 消息 参数 等 几 个 部 分 组 成 。 











ACLCommunicativeAct = Message 

Message = "(" MessageType MessageParameter* ")" 
MessageType = "accept-proposal" | "agree" | "cancel" 
"cfp" | "confirm" | "disconfirm" | "failure" 
"inform" | "inform-if" | "inform-ref” 
"not-understood” | "propose" 

"query-if" | "query-ref" | "refuse" | "reject-proposal" 
"request" | "request-when" | "request-whenever" 
"subscribe". 

MessageParameter = ":sender" AgentName 

":receiver" RecipientExpr 

":content" ( Expression 
MIMEEnhancedExpression ) 

":reply-with" Expression 

":reply-by" DateTimeToken 

":in-reply-to" Expression 

":envelope" KeyValuePairList 

":language" Expression | ":ontology" Expression 
":protocol" Word 





":conversation-id" Expression. 

Expression = Word | String | Number | "(" Expression * ")". 
KeyValuePairList = "(" KeyValuePair * ")". 

KeyValuePair = "(" Word Expression ")". 

RecipientExpr = AgentName | "(" AgentName + ")". 
AgentName = Word | Word "@" URL. 

URL = Word. 








图 6-12 FIPA ACL 的 语法 定义 


FIPA ACL 预定 义 了 一 组 通信 行为 。FIPA ACL 预定 义 的 通信 行为 见 表 6-1, 大 致 可 
分 为 以 下 几 个 类 别 : 信息 传递 .信息 请 求 ,协商 ,动作 执行 和 错误 处 理 。 

根据 FIPA ACL 的 语法 定义 ,一 个 合法 的 ACL 消息 一 般 具 有 如 图 6-13 所 示 的 结构 
和 表示 方式 。 首 先 ,FIPA ACL 消息 必须 描述 消息 的 通信 行为 和 通信 内 容 , 然 后 提供 消息 
对 应 的 一 组 参数 ,包括 发 送 者 .接收 者 内容 描述 语言 本体 等 。 

下 面 列 举 一 些 FIPA ACL 消息 的 例子 ,进一步 分 析 FIPA ACL 消息 的 语法 结构 以 及 
不 同 消息 表述 的 语义 内 容 。 


通信 行为 
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表 6-1 FIPA ACL 预定 义 的 通信 行为 


直观 含义 





信息 
传递 


信息 
请 求 


协商 


动作 
执行 


错误 
处 理 





accept-proposal 


接受 以 前 提交 的 建议 ,以 执行 
一 个 动作 





agree 


同意 执行 某 一 动作 





cancel 


取消 以 前 请 求 执行 的 动作 





cfp 


请 求 一 个 建议 ,以 执行 某 个 
动作 





confirm 


告诉 接收 者 某 个 命题 成 立 





disconfirm 


告诉 接收 者 某 个 命题 不 成 立 





failure 


告诉 接收 者 试图 执行 某 个 动 
作 , 但 是 执行 失败 





inform 


通知 接收 者 某 个 命题 成 立 





inform-if (macro act) 


通知 接收 者 某 个 命题 是 否 
为 真 





inform-ref (macro act) 


通知 接收 者 某 个 描述 对 应 的 
对 象 





not-understood 


不 能 理解 消息 





propose 


提交 一 个 建议 ,以 执行 某 个 
动作 





query-if 


询问 某 个 命题 是 否 成 立 





query-ref 


询问 某 个 表达 式 所 指 的 对 象 





refuse 


拒绝 执行 一 个 动作 





reject-proposal 


在 协商 中 拒绝 接受 一 个 动作 
执行 的 建议 





request 


请 求 执行 一 个 动作 





request-when 


请 求 当 某 个 命题 成 立时 执行 
某 个 动作 





request-whenever 


请 求 当 某 个 命题 成 立时 就 执 
行 某 个 动作 





subscribe 





请 求 一 个 引用 的 值 




















。 FIPA ACL Request 消息 


( request 
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人 消息 的 通信 行为 
消息 开始 
2 inform 


:content (price(bid good02) 150) 
消息 内 容 表达 式 :sender 。 agentl 


:receiver auction-server 





:in-reply-to round4 


消息 参数 :reply-with bid04 
:language KIF 
:ontology auction 


消息 结尾 “一 一 ) 
图 6-13 FIPA ACL 消息 的 结构 和 表示 方式 


:sender i 

:receiver 

:content (action j (deliver box017 (location 12 19))) 
:protocol fipa- request 


:reply- with order567 
) 


该 消息 的 通信 行为 是 request”, Agenti 是 消息 的 发 送 方 ,Agentj 是 消息 的 接收 方 ， 
该 消息 采用 的 交互 协议 为 “fipa-request”, 消 息 内 容 是 “(action j (deliver box017 (location 
12 19)))”, 它 表示 Agentj 执行 动作 已 将 *box017” 送 到 位 置 *(12,19)” 处 ,该 消息 的 标识 
为 “order567”。 根 据 *request” 通 信行 为 的 含义 ( 表 6-1) ,该 消息 表达 的 语义 是 : 消息 发 送 
方 Agenti 要 求 消息 接收 方 Agentj 执行 由 消息 内 容 描述 的 动作 ,Agentj 和 Agenti 之 间 
采用 “fipa-request” 交 互 协议 进行 协同 。 

。FIPA ACL Agree 消息 


(agree 
:sender j 
:receiver 守 
:content ((deliver j box017 (location 12 19))) 


:in- reply- to order567 
:protocol fipa- request 


这 是 一 个 “agree” 类 型 的 消息 ,Agentj 是 消息 的 发 送 方 ,Agenti 是 消息 的 接收 方 ,该 
消息 采用 的 交互 协议 为 “fipa-request”, 消息 内 容 为 “((deliver j box017 (location 12 
19)))”, 该 消息 是 对 标识 为 “order567” 消 息 的 响应 。 根 据 "agree” 通 信行 为 的 含义 ( 表 6-1)， 
该 消息 表达 的 语义 是 : 对 标识 为 “order567” 的 消息 做 出 响应 , Agenti 同意 执行 动作 
“(deliver j box017 (location 12 19))”, 以 将 物体 “box017” 送 到 位 置 “(12,19)” 处 , Agentj 
和 Agenti 之 间 采 用 “fipa-request” 交 互 协议 进行 协同 。 





————— 
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6.5 协调 与 协作 


在 计算 机 科学 领域 ,具有 挑战 性 的 目标 之 一 就 是 如 何 建立 能 够 在 一 起 工作 的 计算 机 
系统 。 随 着 计算 机 系统 越 来 越 复 杂 , 将 智能 Agent 集成 起 来 则 更 具 挑战 性 。 而 Agent 间 
的 协作 是 保证 系统 能 在 一 起 共同 工作 的 关键 。 另 外 ,Agent 间 的 协作 也 是 多 Agent 系统 
与 其 他 相关 研究 领域 (如 分 布 式 计算 、 面 向 对 象 的 系统 、 专 家 系统 等 ) 区 别 开 来 的 关键 性 概 
念 之 一 。 协 调 与 协作 是 多 Agent 研究 的 核心 问题 之 一 ,因为 以 自主 的 智能 Agent 为 中 
心 , 使 多 Agent 的 知识 .愿望 意图、 规划、 行动 协调 ,以 至 达到 协作 ,是 多 Agent 的 主要 
目标 。 


协调 是 指 一 组 智能 Agent 完成 一 些 集体 活动 时 相互 作用 的 性 质 。 协 调 是 对 环境 的 
适应 。 在 这 个 环境 中 存在 多 个 Agent 并 且 都 在 执行 某 个 动作 。 协 调 一 般 是 改变 Agent 
的 意图 ,协调 的 原因 是 由 于 其 他 Agent 的 意图 存在 。 协 作 是 非 对 抗 的 Agent 之 间 保 持 行 
为 协调 的 一 个 特例 。 多 Agent 是 以 人 类 社会 为 范例 进行 研究 的 。 在 人 类 社会 中 ,人 与 人 
的 交互 无 处 不 在 。 人 类 交互 一 般 在 纯 冲突 和 无 冲突 之 间 。 同 样 ,在 开放 ,动态 的 多 Agent 
环境 下 ,具有 不 同 目标 的 多 个 Agent 必须 对 其 目标 、 资 源 的 使 用 进行 协调 。 例 如 ,在 出 现 
资源 冲突 时 , 若 没有 很 好 地 协调 ,就 有 可 能 出 现 死 锁 。 而 在 另 一 种 情况 下 , 即 单个 Agent 
无 法 独立 完成 目标 ,需要 其 他 Agent 的 帮助 ,这 时 就 需要 协作 。 

在 多 Agent 系统 中 ,协作 不 仅 能 提高 单个 Agent 以 及 由 多 个 Agent 形成 的 系统 的 整 
体 行为 的 性 能 ,增强 Agent 及 Agent 系统 解决 问题 的 能 力 , 还 能 使 系统 具有 更 好 的 灵活 
性 。 通 过 协作 使 多 Agent 系统 能 解决 更 多 的 实际 问题 ,拓宽 应 用 。 尽 管 对 单个 Agent 来 
说 , 它 只 关注 自身 的 需求 和 目标 ,因而 其 设计 和 实现 可 以 独立 于 其 他 Agent。 但 在 多 
Agent 系统 中 ,Agent 不 是 孤立 存在 的 。 即 使 由 遵循 某 些 社会 规则 的 Agent 构成 的 多 
Agent 系统 中 ,Agent 的 行为 必须 满足 某 些 预定 的 社会 规范 ,而 不 能 为 所 和 欲 为 。Agent 间 
的 这 种 相互 依赖 关系 使 得 Agent 间 的 交互 以 及 协作 方式 对 Agent 的 设计 和 实现 具有 相 
当 大 的 制约 性 ,基于 不 同 的 交互 及 协作 机 制 ,多 Agent 系统 中 的 Agent 的 实现 方式 各 不 
相同 。 因 此 可 以 说 ,研究 Agent 间 的 协作 是 研究 和 开发 基于 Agent 的 智能 系统 的 必然 

在 现 阶段 ,针对 Agent 协作 的 研究 大 体 上 分 为 两 类 : 一 类 将 其 他 领域 (如 博弈 论 、 经 
典 力 学 理论 等 ) 研 究 多 Agent 行为 的 方法 和 技术 用 于 Agent 协作 的 研究 ;而 另 一 类 则 从 
Agent 的 目标 ,意图 .规划 等 心智 态度 出 发 研究 多 Agent 间 的 协作 ,如 FA/C 模型 .联合 意 
图 框架 共享 规划 等 。 前 一 类 方法 的 适用 范围 远 不 如 后 一 类 广 , 运 用 的 各 种 理论 只 适用 于 
特定 的 协作 环境 下 ,一 旦 环境 发 生变 化 ,如 Agent 的 个 数 、 类 型 及 Agent 间 的 交互 关系 与 
该 理论 所 适用 的 情形 不 一 致 时 ,基于 该 理论 的 协作 机 制 就 失去 了 其 存在 的 优势 。 后 一 类 
方法 则 较 偏 重 于 问题 的 规划 与 求解 ,并 且 它们 假定 的 协作 过 程 差 异 显 著 。 有 的 是 先 找 协 
作 伙 伴 再 规划 求解 ;有 的 是 先 对 问题 进行 规划 ,然后 由 Agent 按照 该 规划 采取 协作 性 的 








务 6 葛 Agent 一 一 257 


行动 ;有 的 则 在 Agent 自主 行动 的 过 程 中 ,进行 部 分 全 局 规划 调整 自己 的 行为 ,以 达到 协 
作 的 目标 。 后 两 种 方式 的 协作 显得 较 松散 ,缺乏 必要 的 意外 处 理 机 制 及 手段 ,并 且 在 
Agent 间 还 必须 存在 共享 的 协作 规划 ;前 一 种 方式 的 协作 的 不 确定 性 较 大 ,其 协作 规划 会 
受 协作 团体 的 影响 和 制约 。 

在 多 Agent 系统 中 ,Agent 是 自主 的 ,多 个 Agent 的 知识 .愿望 、 意 图 和 行为 等 往往 
各 不 相同 ,对 多 个 Agent 的 共同 工作 进行 协调 ,是 多 Agent 系统 的 问题 求解 能 力 和 效率 
得 以 保障 的 必要 条 件 , 包 括 组 织 理 论 、 政 治学 、 社 会 学 、 社 会 心理 学 、 人 类 学 \ 法 律 学 以 及 经 
济 学 等 在 内 的 多 个 学 科 领 域 都 对 协调 进行 了 研究 ,许多 研究 成 果 已 经 应 用 到 多 Agent 系 
统 中 。 多 Agent 系统 中 的 协调 是 指 多 个 Agent 为 了 以 一 致 和 谐 的 方式 工作 而 进行 交互 
的 过 程 。 进 行 协调 是 希望 避免 Agent 之 间 的 死 锁 和 活 锁 。 死 锁 指 多 个 Agent 无 法 进行 
各 自 的 下 一 步 动作 ; 活 锁 是 指 多 个 Agent 不 断 工 作 却 无 任何 进展 的 状态 。 多 Agent 之 间 
的 协调 已 经 有 很 多 方法 ,大 致 归纳 如 下 。 

(1) 组 织 结构 化 (organizational structuring) 。 

(2) 合同 (contracting) 。 

(3) 多 Agent 规划 (multiragent planning) 。 

(4) 协商 Cnegotiation) 。 

从 社会 心理 学 的 角度 看 ,多 Agent 之 间 的 协作 情形 大 致 可 分 为 

(1) 协作 型 : 同时 将 自己 的 利益 放 在 第 二 位 。 

(2) 自私 型 : 同时 将 协作 放 在 第 二 位 。 

(3) 完全 自私 型 : 不 考虑 任何 协作 。 

(4) 完全 协作 型 : 不 考虑 自身 利益 。 

(5) 协作 与 自私 混合 型 。 

Agent 的 交互 有 两 种 关系 : 负 关 系 和 正 关系 。 负 关系 导致 冲突 ,对 于 冲突 的 消解 构 
成 协调 。 正 关系 表示 Agent 的 规划 有 重生 部 分 ,或 某 个 Agent 具有 其 他 Agent 不 具备 的 
能 力 , 各 Agent 可 以 通过 协作 获得 帮助 。 

20 世纪 80 年 代 中 期 以 前 ,分 布 式 人 工 智能 对 协调 与 协作 的 研究 主要 在 无 目标 
冲突 的 情况 下 互相 帮助 ,实现 目标 。 这 种 研究 适用 于 分 布 式 问 题 求解 。20 世纪 80 
年 代 中 期 ,Rosenschein 针对 Agent 目标 有 冲突 情况 下 的 交互 ,运用 对 策 论 建立 了 “ 理 
性 Agent(rational Agent) ”交互 的 静态 模型 ,成 为 多 Agent 协调 与 协作 问题 的 形式 化 
理论 基础 。 此 后 ,许多 学 者 运用 对 策 论 对 多 Agent 的 协商 规划 、 协 调 进行 了 形式 化 
研究 。 这 些 研 究 都 是 在 Agent 目标 矛盾 的 前 提 下 ,如 何 通过 建立 对 方 模型 或 通过 协 
商 协调 各 自行 为 ,或 通过 协作 实现 共同 目标 。 有 的 研究 考虑 时 间 偏 好 ,有 的 研究 面 
向 开放 环境 。 

马萨诸塞 大 学 在 强化 FA/C 与 PGP( 部 分 全 局 规划 ) 方 法 的 基础 上 ,采用 元 级 通信 的 
方法 协调 Agent 的 计算 。MacIntosh 运用 启发 式 方法 将 协作 引入 机 器 定理 证 明 。Sycara 
以 劳资 谈判 为 背景 研究 协商 问题 。 该 方法 使 用 启发 式 与 约束 满足 技术 解决 分 布 式 搜索 问 
题 ,使 用 异步 回溯 恢复 不 一 致 的 搜索 决策 。 其 缺点 是 需要 一 个 仲裁 器 解决 冲突 。Conry 
研究 了 多 目标 、 多 资源 条 件 下 的 多 步 协商 。Hewitt 提出 开放 分 布 式 人 工 智能 系统 的 思 
想 , 对 Rosenschein 的 静态 交互 模型 提出 挑战 ,现实 世界 是 开放 的 动态 的 ,协调 与 协作 也 
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应 是 开放 的 ,动态 的 。 计 算 生态 学 认为 ,Agent 在 开放 的 动态 的 环境 中 不 一 定 具备 很 强 
的 推理 能 力 , 而 可 以 通过 不 断 的 交互 ,逐步 协调 与 环境 以 及 各 自 之 间 的 关系 ,使 整个 系统 
体现 一 种 进化 能 力 ,类似 于 生态 系统 。 在 BDI 模型 中 则 强调 交互 作用 中 Agent 信念、 愿 
望 和 意图 的 理性 平衡 。 

Shohan 等 提出 为 人 工 Agent 社会 规定 一 套 法 规 ,要 求 每 个 Agent 必须 遵守 ,并 且 相 
信 别 的 Agent 也 会 遵守 。 这 些 法 规 一 方面 会 限制 每 个 Agent 所 能 采取 的 行动 , 另 一 方面 
也 可 以 确保 其 他 Agent 会 有 什么 样 的 行为 方式 ,从 而 保证 本 Agent 行为 的 可 实现 性 。 
Decker 等 人 提出 一 种 用 于 分 布 式 传感器 网 络 的 动态 协调 算法 ,各 Agent 按照 统一 标准 动 
态 修改 本 Agent 负责 的 传感器 区 域 .可 以 自动 达成 各 区 域 边界 的 协调 。 这 种 动态 重 构 处 
理 区 域 可 以 在 整个 系统 内 实现 负载 均衡 ,性 能 优 于 静态 分 区 算法 ,尤其 是 可 以 降低 性 能 的 
波动 性 ,更 适合 于 动态 实时 情形 。 

在 多 Agent 规划 系统 中 ,可 以 通过 规定 各 种 行为 与 目标 的 相关 性 而 达成 行为 序列 的 
自发 协调 。 德 国 摹 尼 黑 技 术 大 学 的 WeiB 通过 分 布 式 学 习 , 形 成 对 某 个 问题 的 一 组 行为 
与 目标 的 相关 值 。 自 发 协调 的 另 一 种 方法 是 Kosoresow 提出 的 Markov 过 程 。 在 Agent 
目标 和 偏好 相 容 的 情况 下 ,Markov 过 程 是 一 种 快速 的 概率 性 的 协调 方法 。 将 Markov 过 
程 作为 Agent 的 推理 机 制 ,可 以 分 析 Agent 交互 过 程 的 收敛 性 和 平均 收敛 时 间 。 当 
Agent 目标 和 偏好 不 相 容 时 ,可 以 在 某 个 时 间 限 制 点 检测 出 不 相 容 , 并 提交 给 更 高 层 的 协 
调 协 议 。 为 了 描述 协同 工作 的 一 群 Agent 行为 ,需要 用 共同 意图 将 群体 成 员 的 行为 联结 
起 来 。Jennings 等 采用 共同 责任 概念 ,强调 意图 作为 行为 控制 器 的 作用 ,规定 各 Agent 
在 协作 问题 求解 中 应 该 如 何 行动 。 这 种 共同 责任 可 以 为 系统 结构 设计 提供 功能 指导 ,为 
监控 问题 求解 提供 标准 ,为 异常 处 理 提供 准则 。 


6.5.2 合同 网 


1980 年 ,Smith 在 分 布 式 问题 求解 中 提出 了 一 种 合同 网 协议 (contract net protocol) 。 
后 来 这 种 协议 广泛 用 在 多 Agent 系统 的 协调 中 。Agent 之 间 通 信和 经 常 建立 在 约定 的 消息 
格式 上 。 实 际 的 合同 网 系统 基于 合同 网 协议 提供 一 种 合同 协议 ,规定 任务 指派 和 有 关 
Agent 的 角色 。 图 6-14 给 出 了 合同 网 系统 中 结 点 的 结构 。 
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图 6-14 合同 网 系统 中 结 点 的 结构 


本 地 知识 库 包 括 与 结 点 有 关 的 知识 库 、 协 作协 商 当 前 状态 和 问题 求解 过 程 的 信息 。 
另外 3 个 部 件 利用 本 地 知识 库 执行 它们 的 任务 。 通 信 处 理 器 与 其 他 结 点 进行 通信 , 结 点 
仅 通 过 该 部 件 直接 与 网 络 相 接 , 特 别 是 通信 和 处理 器 应 该 理解 消息 的 发 送 和 接收 。 

合同 处 理 器 判断 投标 提供 的 任务 ,发 送 应 用 和 完成 合同 。 它 也 分 析 和 解释 到 达 的 消 


息 。 最 后 ,合同 处 理 器 执行 全 部 结 点 的 协调 。 任 党 理 器 





务 处 理 器 的 任务 是 处 理 任 务 赋予 它 的 处 理 和 求 | 子 问题 
解 。 它 从 合同 处 理 器 接收 所 要 求解 的 任务 ,利用 
本 地 知识 库 进行 求解 ,并 将 结果 送 到 合同 处 理 器 。 

合同 网 工作 时 ,将 任务 分 成 一 系列 子 问题 。 
有 一 个 特定 的 结 点 称 作 管 理 器 , 它 了 解 子 问题 的 空 




















任务 (图 6-15)。 
管理 器 提供 投标 , 即 要 解 而 尚未 求解 的 子 问 
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接收 投标 
应 用 求解 
求解 合同 
完成 合同 
确认 
子 问题 的 解 
结 
子 解 子 解 














题 合同 。 它 使 用 合同 协议 定义 的 消息 结构 ,例如 图 6-15 合同 网 系统 中 的 合同 协商 过 程 


To: All nodes 

FROM: Manager 

TYPE: Task bid announcement 

ContractID: xXx- yy- 22 

Task Abstraction: < description of the problem> 

Eligibility Specification: <list of the minimum requirements> 

Bid Specification: < description of the requires application information> 
Expiration time < latest possible application time> 


标书 对 所 有 Agent 都 是 开放 的 ,通过 合同 处 理 器 进行 求解 。 使 用 本 地 知识 库 求解 当 
前 可 用 的 资源 和 Agent 知识 。 合 同 处 理 器 决定 该 公布 的 任务 申请 是 不 是 要 做 。 如 果 要 


做 , 它 将 按 下 面 结构 通知 管理 器 。 
To: Manager 
FROM: Node X 
TYPE: Application 
ContractID: xXx- YY- 22 
Node Abstraction: < description of the node's capabilities> 


管理 器 必须 选择 应 用 中 最 适合 所 给 合同 的 结 点 。 管 理 器 访问 具体 的 求解 知识 和 方 
法 ,选择 最 好 成 绩 ,将 合同 有 关 的 子 问题 求解 任务 交 给 该 结 点 。 根 据 合 同 消息 管理 器 指派 


合同 如 下 。 
To: Node X 
FROM: Manager 
TYPE: Contract 
ContractID: XX- YY- 22 
Task Specification < description of the subproblem> 


通信 结 点 发 送 确认 消息 到 管理 器 ,以 规定 的 形式 确认 接收 合同 。 当 问题 求解 阶段 完 
成 ,已 解 的 问题 传 给 管理 器 。 承 诺 的 结 点 完全 负责 子 问题 的 求解 , 即 完成 合同 。 合 同 网 系 
统 纯粹 是 任务 分 布 。 结 点 不 接收 其 他 结 点 当前 状态 的 任何 信息 。 如 果 结 点 随后 认为 所 安 
排 的 任务 超过 了 它 的 能 力 和 资源 ,那么 可 以 进一步 划分 子 问 题 , 分 配子 合同 到 其 他 结 点 。 
这 时 , 它 用 作 管 理 器 角色 ,提交 子 问题 标书 。 形 成 分 层 任务 结构 ,每 个 结 点 可 以 同时 是 管 


理 器 ,投标 申请 者 和 合同 成 员 。 
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原来 ,合同 网 系统 做 了 一 些 扩充 ,影响 协商 的 过 程 。 其 中 之 一 是 公布 标书 。 所 有 结 点 
都 可 以 参加 投标 ,这 要 求 通信 频繁 和 丰富 的 资源 。 管 理 器 必须 评价 大 量 的 投标 书 , 使 用 大 
量 的 资源 。 管 理 器 很 重 的 负载 可 能 是 公共 的 投标 请 求 造 成 的 。 首 先 , 它 要 有 能 力 只 通知 
投标 中 的 一 小 部 分 。 可 以 想象 ,管理 器 具有 各 个 结 点 能 力 的 具体 知识 ,那么 它 就 能 粗略 估 
计 处 理子 问题 的 可 能 的 候选 结 点 。 其 次 ,公共 投标 请 求 完全 可 以 取消 。 如 果 未 解 的 子 问 
题 可 以 采用 以 前 求解 问题 的 方法 构建 ,那么 ,管理 器 可 以 直接 与 过 去 求解 问题 的 结 点 联 
系 , 如 果 资源 可 以 利用 ,就 签订 合同 。 另 外 , 结 点 自己 也 可 以 投标 。 这 种 情况 下 ,管理 器 许 
多 开放 的 投标 只 是 调查 新 的 任务 。 投 标 请 求 只 是 在 没有 找到 合适 的 投标 者 时 需要 。 

合同 网 系统 扩充 的 第 二 方面 是 影响 实际 合同 的 指派 。 原 协议 中 ,管理 器 在 指派 合同 
后 要 等 待 接收 有 关 结 点 的 信息 。 当 确认 信息 到 来 之 前 ,管理 器 不 知道 结 点 是 否 接收 合同 。 
结 点 投标 后 并 未 形成 合同 ,没有 建立 合同 约束 。 建 议 的 扩充 是 将 合同 约束 建立 移 到 协商 
的 早期 。 例 如 , 当 一 个 结 点 投标 时 ,可 以 提供 后 面 接受 承诺 可 能 的 条 款 。 与 此 相关 ,接受 
可 能 性 不 是 简单 的 接受 或 拒绝 ,可 以 带 有 一 些 参 数 或 条 件 。 合 同 确认 的 最 大 期 限 是 进 一 
步 的 扩充 。 如 果 在 规定 期 限 内 结 点 没有 确认 合同 ,那么 管理 器 将 中 断 合 同 。 合 同 处 理 器 
也 可 以 发 送信 息 , 避 免 管理 器 等 待 太 长 的 时 间 , 在 最 长 时 间 间 隔 之 前 ,管理 器 就 可 以 重新 
指派 合同 。 


6.5.3 协作 规划 


一 般 来 说 , 当 某 个 Agent 相信 通过 协作 能 带 来 好 处 (如 提高 效率 、 完 成 以 往 单独 无 法 
完成 的 任务 ) 时 ,就 会 产生 协作 的 愿望 ,进而 寻求 协作 伙伴 ;或 者 当 多 个 Agent 在 交流 过 
程 中 发 现 它们 能 够 通过 协作 实现 更 大 的 目标 时 ,可 能 会 结 成 同盟 ,并 采取 协作 性 的 行动 。 
在 现实 生活 中 ,产生 协作 的 情形 与 此 相似 。 壁 如 ,一 个 企业 主 为 实现 某 种 企业 目标 而 招聘 
合适 的 工作 人 员 ,多 个 具有 共同 利益 的 企业 组 成 一 个 大 的 集团 以 追求 更 大 的 收益 等 。 尽 
管 产生 协作 的 背景 会 存在 一 定 的 差异 ,但 我 们 都 可 以 借用 现实 生活 中 的 “ 因 需 设 岗 ,竞争 
上 岗 ” 原 则 予以 概括 。 该 原则 的 直观 含义 是 : 根据 目标 及 协作 的 需要 设 定 恰当 的 岗位 并 
配备 相应 的 角色 ,而 希望 参与 协作 的 竞争 者 则 通过 竞争 获得 能 胜任 的 岗位 并 扮演 相应 的 
角色 。 虽然 在 后 一 种 产生 协作 的 情形 中 ,似乎 是 先 有 协作 参与 者 后 有 协作 目标 ,但 这 实质 
上 并 不 违背 该 原则 。 我 们 认为 协作 目标 总 是 先 于 协作 团体 存在 ,只 是 有 时 隐藏 在 某 个 角 
落 一 时 没 被 发 现 而 已 ,因而 后 一 种 情形 只 能 说 明 他 们 发 现 了 某 种 他 人 尚未 发 现 的 但 已 存 
在 的 目标 ,并 且 不 再 需要 竞争 就 能 各 自 扮演 自己 的 角色 。 这 里 我 们 将 依照 " 因 需 设 岗 , 竞 
争 上 岗 ” 原 则 研究 多 Agent 间 的 协作 行为 。 我 们 将 规划 、 竞 争 、 约 束 、 协 调 纳入 一 个 协作 
框架 中 对 多 Agent 间 的 协作 过 程 进行 研究 ,并 将 协作 过 程 分 为 6 个 阶段 : @ 产 生 需 求 , 确 
定 目标 ; 四 协作 规划 ,求解 协作 结构 ; @@ 寻 求 协作 伙伴 ; @ 选 择 协作 方案 ; 加 实现 目标 ; 
@ 评 估 结 果 。 

在 对 协作 过 程 予以 形式 化 的 描述 时 ,我 们 将 不 再 局 限于 某 一 种 特定 的 形式 化 方法 ,如 
d Inverno 等 使 用 的 Z 表示 法 、Fisher 等 使 用 的 时 态 逻 辑 、Rao 等 使 用 的 基于 分 支 时 间 的 
模 态 迎 辑 等 。 虽 然 基于 逻辑 的 形式 化 方法 在 表示 Agent 的 心智 态度 及 时 序 方面 的 性 质 
时 有 其 独到 之 处 ,但 用 逻辑 公式 描述 的 Agent 行为 规范 离 具 体 的 实现 还 有 很 大 的 一 段 距 
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离 , 这 是 因为 从 规范 描述 到 具体 实现 的 求 精 过 程 是 一 个 相当 复杂 和 难 解 的 问题 。 这 说 明 
纯 逻 辑 的 方法 在 刻画 Agent 的 静态 性 质 和 规范 时 有 其 固有 的 优势 ,但 它们 很 难 刻画 
Agent 的 动态 行为 以 及 Agent 间 的 通信 及 交互 结构 。 另 外 ,基于 进程 代数 的 进程 演算 (如 
x 演算) 不 仅 能 刻画 Agent 的 动态 行为 过 程 ,还 能 刻画 多 个 Agent 间 具 有 并 发 性 的 交互 及 
协作 结构 ,并 提供 了 分 析 这 些 结构 的 相关 性 质 的 手段 。 因 此 ,我 们 从 两 个 层面 上 使 用 这 两 
类 方法 ,并 试图 将 它们 融合 起 来 。 在 规范 描述 Agent 间 的 协作 行为 时 ,首次 将 逻辑 和 进 
程 代数 方 法 巧妙 地 融 进 一 个 统一 的 形式 化 框架 中 。 在 定义 Agent 的 协作 目标 时 ,将 使 用 
时 态 逻 辑 方法 予以 描述 ,而 Agent 间 的 协作 结构 以 及 交互 过 程 则 通过 x 演算 进行 刻画 ; 
协作 目标 以 及 协作 结构 则 在 实现 协作 目标 的 过 程 中 联系 起 来 。 

1. 形式 化 框架 

在 刻画 Agent 间 的 协作 过 程 的 各 阶段 时 ,将 分 别 采 用 不 同 的 形式 化 框架 进行 描述 ， 
同时 在 协作 过 程 中 将 它们 以 某 种 方式 联系 起 来 。 

这 里 采用 的 逻辑 框架 主要 是 基于 时 态 逻 辑 的 ,并 在 时 态 巡 辑 的 基础 上 添加 了 若干 与 
Agent 行为 有 关 的 模 态 算 子 。 

时 态 逻 辑 语言 TL 是 在 经 典 一 阶 谓词 逻辑 的 基础 上 增加 一 组 用 来 表示 事件 的 时 间 顺 
序 的 模 态 连接 符 而 构成 的 。 在 时 态 逻 辑 中 存在 两 类 时 序 连 接 符 : 过 去 时 的 连接 符 和 现在 
及 将 来 时 的 连接 符 。 本 章 只 考虑 现在 及 将 来 时 的 时 序 连接 符 , 如 * 〇 ?”( 下 一 次 )“@”( 终 
将 )“ 口 ?( 总 是 )“U”( 直 到 )“W”( 除 非 ) ,其 中 { DO,@, 口 }) 为 一 元 连接 符 , 而 {U, W ) 为 
二 元 连接 符 。 另 外 ,为 了 便于 刻画 Agent 的 心智 态度 ,定义 了 一 组 新 的 模 态 算 子 ,如 信念 
算 子 (Bel) .能力 算 子 (Can) 等 。 

7 演算 是 一 种 很 基本 的 演算 ,用 通信 结构 描述 和 分 析 并 发 系统 。 在 两 种 形式 化 框架 
中 ,基于 时 态 逻 辑 的 框架 主要 刻画 Agent 的 属性 ,基于 进程 演算 的 框架 主要 刻画 Agent 
的 动态 行为 以 及 行为 间 的 关系 。 这 样 ,在 用 时 态 逻 辑 描述 的 Agent 性 质 中 ,我 们 可 以 把 
Agent 的 行为 及 动作 看 成 是 一 个 或 一 系列 进程 ,而 进程 的 演化 ( 即 计 算 ) 必 须 受 Agent 属 
性 ( 即 某 种 时 态 多 辑 公式 ) 的 限制 。 

2. 协作 模型 和 结构 

这 里 提出 一 种 * 因 需 设 岗 ,竞争 上 岗 ” 多 Agent 协作 的 协作 模式 ,协作 过 程 分 为 6 个 
阶段 。 据 此 ,可 以 将 协作 模型 定义 如 下 。 

M=<Ag,G,P,T,S> 





























其 中 ， 

Ag 一 一 协调 Agent。 在 整个 协作 过 程 中 ,除了 必须 存在 多 个 参与 协作 实现 协作 目标 
的 协作 参与 者 外 ,还 存在 负责 多 Agent 协作 的 协调 者 。 协 作协 调 者 一 方面 提出 协作 需 
求 , 并 对 协作 目标 进行 规划 ; 另 一 方面 ,协作 协调 者 还 负责 根据 竞争 者 的 条 件 挑选 恰当 的 
协作 伙伴 。 

G 一 一 协作 目标 ,由 协调 Agent 在 特定 的 情况 下 产生 。 

P 一 一 协作 规划 ,规划 的 关键 是 构造 出 问题 的 协作 结构 , 即 完成 “ 因 需 设 岗 , 竞 争 上 
岗 ” 中 的 第 一 步 , 确 定 完成 协作 任务 所 需 的 角色 、 角 色 的 相关 性 质 , 以 及 各 角色 之 间 的 依赖 

T 一 一 协作 伙伴 集合 , 即 参与 协作 的 协作 团体 , Ag € T。 协 作 团 体 的 形成 是 协调 
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Agent 根据 各 Agent 竞争 相应 的 协作 角色 的 有 关 信息 而 确定 的 。 

S 一 一 协作 方案 , 它 与 协作 伙伴 对 应 ,SGEP。 

Agent 间 的 协作 目标 包括 两 部 分 : 四 任务 目标 , 即 协作 应 完成 何 种 工作 ; 四 性 能 目 
标 , 即 Agent 应 在 特定 的 性 能 指标 下 协作 完成 工作 ,如 Agent 必须 在 特定 的 时 间 及 资源 
等 限制 下 实现 任务 性 目标 等 。Agent 的 任务 性 目标 和 性 能 指标 都 可 以 用 不 含 模 态 算 子 的 
时 序 公式 定义 。 

协作 规划 的 结果 是 建立 协作 结构 , 即 求解 协作 方案 、 确 定 完成 协作 任务 所 需 的 角色 、 
角色 的 相关 性 质 以 及 各 角色 之 间 的 依赖 关系 。 协 作 结构 主要 用 来 规定 如 何 将 协作 目标 逐 
步 细 化 ,以 便 将 各 个 子 任务 分 派 给 参与 协作 的 Agent。 

在 定义 协作 结构 时 ,定义 了 一 种 有 向 图 式 的 目标 关系 图 。 在 定义 该 关系 图 时 ,没有 增 
加 特殊 的 限制 (如 是 否 允 许 出 现 有 向 环 等 )。 但 在 Agent 的 协作 过 程 中 , 若 目 标 关系 图 中 
出 现 了 有 向 环 , 则 Agent 间 的 协作 会 出 现 死 锁 。 但 考虑 到 在 协作 规划 阶段 还 没有 选中 具 
体 的 协作 方案 ,即使 最 初 的 协作 结构 中 出 现 了 有 向 环 ,只 要 最 终 选择 的 协作 方案 中 不 存在 
死 锁 , 则 协作 仍然 能 顺利 进行 。 因此, 我们 把 死 锁 问题 放 在 选择 协作 方案 阶段 考虑 。 

3. 协作 方案 

寻找 协作 伙伴 的 过 程 实质 上 就 是 一 个 选择 协作 方案 的 过 程 ,因为 一 旦 协作 伙伴 确定 
后 ,协作 方案 也 就 相应 地 确定 了 。 为 了 减少 寻找 协作 伙伴 的 盲目 性 ,提高 效率 ,有 必要 先 
对 协作 结构 做 一 定 的 优化 处 理 , 排 除 不 可 能 达到 目标 的 协作 方案 。 

考察 协作 结构 进程 中 的 每 一 个 组 合子 进程 ,看 与 之 发 生 联系 的 目标 关系 是 否 构 成 有 
向 环 。 若 出 现 了 有 向 环 , 则 说 明 若 选择 该 协作 方案 会 出 现 死 锁 ,协作 将 不 可 能 进行 ,因此 
它 不 是 可 选 的 协作 方案 ,必须 从 协作 结构 进程 中 删 去 。 

剩 下 的 组 合子 进程 都 是 可 选择 的 协作 方案 。 

在 对 协作 结构 进行 优化 的 同时 ,实际 上 也 在 对 协作 目标 “与 /或 ” 树 进行 修剪 。 修 剪 后 
的 “与 /或 ” 树 中 的 所 有 叶 结 点 都 可 以 作为 一 个 可 竞争 的 岗位 和 角色 供 各 Agent 进行 
竞争 。 

Agent 竞争 及 确定 协作 伙伴 的 过 程 可 以 描述 如 下 。 

(1) 协作 协调 者 根据 协作 结构 向 外 界 公布 可 竞争 的 岗位 和 角色 。 

(2) 各 竞争 Agent 根据 自己 的 能 力 竞争 相应 的 岗位 和 角色 ,并 提交 相关 信息 ,如 有 能 
力 胜任 何 种 工作 、 完 成 任务 可 能 需要 的 时 间 以 及 实现 目标 所 需 的 资源 等 。 

(3) 根据 竞争 Agent 提交 的 信息 ,挑选 最 合适 扮演 某 一 角色 的 Agent, 挑 选 标 准 可 根 
据 Agent 的 竞争 信息 及 各 要 素 的 权重 计算 得 到 。 

判断 并 选择 可 实现 协作 目标 的 最 佳 协作 方案 。 一 种 协作 方案 要 成 为 可 选 方案 ,必须 
满足 : 该 协作 方案 中 规定 的 全 部 角色 都 有 竞争 者 ; @ 准 备 参与 协作 的 所 有 Agent 的 综 
合 指 标 满足 了 协作 目标 的 性 能 指标 。 其 中 ,第 一 点 很 容易 判断 ,而 第 二 点 在 判断 之 前 必须 
先 计算 出 其 综合 指标 到 底 是 多 少 。 

从 前 面 描述 的 协作 结构 进程 中 可 以 看 出 ,每 一 种 协作 方案 都 是 若干 个 并 发 进程 的 组 
合 。 如 果 这 些 并 发 进程 可 以 同时 运行 , 即 各 Agent 能 完全 并 行 地 完成 自己 所 承诺 的 任 
务 , 那 么 ,协作 方案 的 综合 指标 就 很 容易 计算 得 到 ,其 中 ,所 需 时 间 为 协作 Agent 中 最 大 
的 承诺 时 间 ,而 资源 占用 或 消耗 量 则 为 各 Agent 所 需 资源 之 和 。 但 我 们 在 定义 协作 结构 
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时 ,同时 还 为 并 发 进程 定义 了 一 系列 关系 ( 即 目标 关系 R)。 当 并 发 进程 间 存 在 某 种 关系 
限制 时 ,组 合 进程 内 的 并 发 子 进 程 就 不 再 是 完全 并 行 地 运行 ,整个 组 合 进程 的 执行 时 间 和 
占用 的 资源 量 就 会 发 生变 化 。 无 论 在 哪 种 情形 下 ,每 一 种 协作 方案 ( 即 经 过 优化 后 的 协作 
结构 进程 中 的 各 组 合子 进程 ) 所 需 的 时 间 及 资源 需求 总 量 都 可 以 根据 如 下 算法 计算 得 到 。 

(1) 根据 组 合 进程 内 的 各 子 进 程 间 的 关系 R 构造 以 这 些 子 进程 为 结 点 的 有 向 图 , 即 
该 协作 方案 对 应 的 目标 关系 子 图 。 

(2) 找到 任 一 入 边 度 数 为 0 而 出 边 度数 大 于 0 的 结 点 , 设 为 v。 

(3) 逐一 考察 与 该 结 点 相连 的 所 有 结 点 , 设 为 u;。 将 wu 中 的 时 间 量 用 v 和 w; 的 时 间 
量 之 和 代替 ,而 资源 量 用 wv 和 ww; 中 较 大 的 资源 量 蔡 换 。 最 后 从 有 向 图 中 删除 结 点 v。 

(4) 回 到 第 (2) 步 ,直到 找 不 到 那样 的 结 点 为 止 。 

(5) 剩 下 的 结 点 所 对 应 的 进程 可 以 完全 并 发 地 和 运行。 这样 ,整个 组 合 进程 , 即 该 协作 
方案 所 需 的 时 间 量 为 这 些 剩 余 结 点 时 间 量 中 的 最 大 值 , 而 资源 需求 量 则 为 所 有 剩余 结 点 
资源 量 之 和 ;至 此 ,算法 结束 。 

从 协作 结构 的 优化 过 程 中 不 难看 出 ,优化 后 的 协作 结构 中 不 再 存在 有 向 环 ,所 以 上 述 
算法 对 协作 结构 中 的 每 种 协作 方案 都 能 结束 , 即 都 能 求 出 该 方案 所 需 的 时 间 及 资源 指标 。 

协作 伙伴 在 扮演 竞争 到 的 角色 ( 即 开始 进行 协作 ) 前 ,首先 必须 相互 信赖 , 即 协作 团体 
中 的 每 个 Agent 都 相信 自己 和 其 他 Agent 都 能 完成 各 自 承 诺 的 任务 ,这 样 协 作 才能 进行 
下 去 。 其 次 ,参与 协作 的 Agent 一 旦 做 出 承诺 ,就 必须 采取 行动 实现 目标 。 这 样 ,如 果 协 
作 伙 伴 相互 信任 , 且 会 对 自己 的 目标 做 出 承诺 ,并 保证 目标 的 实现 ,多 Agent 间 的 协作 就 
可 以 顺利 进行 。 

4. 协作 过 程 分 析 

以 实现 协作 目标 为 出 发 点 的 多 Agent 间 的 协作 行为 必须 满足 特定 的 性 质 或 标准 ,这 
些 性 质 包 括 : DAgent 间 应 该 相互 响应 ; 四 所 有 Agent 应 对 联合 行动 做 出 承诺 ; @@ 每 个 
Agent 应 承诺 对 相互 之 间 的 行动 给 予 支持 ,以 及 协作 过 程 中 不 发 生死 锁 , 能 满足 特定 的 环 
境 约 束 等 。 在 协作 过 程 中 ,Agent 性 质 表 现在 如 下 几 个 方面 。 

(1) Agent 之 间 相 互信 赖 。 

(2) Agent 对 协作 行动 予以 承诺 ,并 保证 在 正常 情况 下 不 影响 协作 的 顺利 进行 。 

(3) 无 死 锁 的 协作 过 程 。 在 选择 协作 方案 阶段 ,首先 对 规划 阶段 求解 出 的 协作 结构 
进行 优化 ,排除 死 锁 出 现 的 可 能 性 。 

(4) 协作 与 约束 。 在 协作 目标 中 ,不 仅 定义 了 多 Agent 应 完成 的 任务 , 即 任务 性 目 
标 ,还 定义 了 多 Agent 在 协作 过 程 中 应 满足 的 环境 限制 或 约束 , 即 性 能 指标 。 

(5) 协作 与 协调 。Agent 间 的 协作 往往 离 不 开 协 调 ,因此 ,我 们 在 定义 Agent 的 协作 
结构 时 ,定义 了 一 种 目标 关系 图 ,用 来 限定 Agent 行为 之 间 的 相互 关系 。 同 时 ,我 们 将 目 
标 关系 进程 与 目标 结构 进程 组 合 在 一 起 ,从 而 保证 了 多 Agent 行为 的 协调 性 。 


6.6 移动 Agent 


移动 Agent(Mobile Agent, MA) 是 一 类 特殊 的 Agent, 它 除了 具有 智能 Agent 的 最 
基本 特性 一 一 自主 性 、 反 应 性 、 主 动 性 和 交互 性 外 ,还 具有 移动 性 , 即 它 可 以 在 网 络 上 从 一 











264 人 工 乔 能 ( 荔 3 瞩 ) 


台 主 机 自主 地 移动 到 另 一 台 主 机 ,代表 用 户 完成 指定 的 任务 。 移 动 Agent 可 在 异 构 的 
软 、 硬 件 网 络 环境 中 移动 。 移 动 Agent 计算 模式 能 有 效 地 降低 分 布 式 计 算 中 的 网 络 负 
载 ,提高 通信 效率 ,支持 离线 计算 ,支持 异步 自主 交互 ,可 动态 适应 网 络 环境 ,具有 安全 性 
和 容错 能 力 。 移 动 Agent 计算 模式 集中 了 其 他 传统 分 布 式 技术 (如 客户 /服务 器 模式 、 分 
布 式 对 象 技术 、 移 动 代码 技术 ) 的 优点 ,并 结合 分 布 式 人 工 智 能 技术 提供 了 一 个 普遍 的 、 开 
放 的 、 广 义 的、 简便 的 分 布 式 应 用 开发 框架 , 较 之 传统 的 网 络 编程 方式 更 适合 于 网 络 应 用 
系统 的 开发 。MA 的 这 些 优 点 决定 了 其 广泛 的 应 用 前 景 ,如 应 用 于 电子 商务 、 个 人 助理 、 
安全 代理 ,分布 式 信息 查询 网 络 管理 ,信息 监测 与 通告 ,信息 与 软件 分 发 .并 行 处 理 等 


6.6.1 移动 Agent 产生 的 背景 


随 着 Internet/ WWW 的 迅速 发 展 ,用 户 定位 、 处 理 感 兴趣 的 信息 变 得 异常 困难 。 日 
益 庞 大 的 网 络 及 其 异 质 性 对 网 络 管理 和 互 操 作 提 出 了 新 的 挑战 。 如 何 合理 .有效 地 利 
用 Internet 上 巨大 的 计算 资源 成 为 计算 机 工作 者 们 关注 的 重要 问题 。 当 前 流行 的 分 布 
式 计 算 技 术 都 基于 Client/Server 模式 ,通过 远程 过 程 调用 或 消息 传递 等 方式 进行 远程 
通信 ,比较 适合 稳定 的 网 络 环境 和 应 用 场合 。 随 着 新 型 网 络 应 用 (如 移动 计算 ) 的 出 
现 ,Client/Server 模式 的 缺点 日 益 明 显 , 远 不 能 适应 当今 快速 多 变 的 网 络 应 用 发 展 , 移 
动 Agent 技术 集 智 能 Agent、 分 布 式 计 算 、. 通 信 技 术 于 一 体 ,提供 了 一 个 强大 的 、 统 一 
的 ,开放 的 计算 模式 ,更 适合 于 提供 复杂 的 服务 (如 复杂 的 Internet 信息 搜索 、Internet 
智能 信息 管理 等 ) 。 

1. 移动 Agent 是 分 布 式 技术 发 展 的 结果 

移动 Agent 技术 是 在 消息 传递 .远程 过 程 调用 、 远 程 求 值 .客户 /服务 器 模式 .代码 点 
用 等 技术 基础 上 发 展 的 。 

消息 传递 (message passing) 一 一 进行 通信 的 两 个 进程 使 用 发 送 原 语 (send) 和 接收 原 
语 (receive) 进 行 消息 的 发 送 和 接收 。 

远程 过 程 调用 (Remote Procedure Call, RPC) 一 一 消息 传递 机 制 需要 程序 设计 人 员 
给 出 网 络 地 址 和 同步 点 ,通信 层次 太 低 。 远 程 过 程 调用 对 此 进行 了 改进 , 它 隐 蔽 了 网 络 的 
有 具体 细节 ,使 得 用 户 使 用 远程 服务 就 像 进行 一 个 本 地 函数 调用 一 样 , 但 在 通信 过 程 中 需要 
远程 与 本 地 进行 频繁 的 交互 。 

远程 求 值 (Remote Evaluation,REV) 一 一 远程 求 值 允许 网 络 中 的 结 点 向 远程 结 点 发 
送 子 程序 和 参数 信息 。 远 程 结 点 启动 该 子 程序 ”, 一 些 初始 请 求 可 由 该 子 程序 发 出 ,中 间 
结果 也 由 该 子 程序 处 理 , 而 不 是 发 回 源 结 点 , 子 程序 只 是 将 最 后 的 处 理 结果 返回 到 源 

客户 /服务 器 (Client/Server,C/S) 模 式 一 一 在 客户 /服务 器 通信 模型 中 ,通信 的 实体 
双方 有 固定 、 预 先 定义 好 的 角色 : 服务 器 提供 服务 ,客户 使 用 服务 。 这 种 模式 隐 含 了 一 种 
严格 的 依赖 关系 : 客户 依赖 于 服务 器 所 提供 的 服务 而 工作 。 客 户 发 出 服务 请 求 , 然 后 在 
服务 器 上 完成 任务 ,最 后 服务 器 将 处 理 结果 返回 到 客户 机 。 引 入 客户 和 服务 器 的 角色 ， 
RPC 模式 和 REYV 模式 都 是 客户 /服务 器 模式 的 一 种 。 
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代码 点 用 (code-on-demand) 一 一 针对 C/S 结构 中 资源 过 于 集中 的 缺点 ,代码 点 用 模 
式 使 用 了 代码 移动 技术 , 即 在 需要 远程 服务 时 ,首先 从 远程 获得 能 执行 该 服务 的 代码 。 代 
码 点 用 模式 最 典型 的 例子 是 Java 中 的 applet( 应 用 小 程序 ) 和 servlet( 服 务 小 程序 )， 
applet 从 服务 器 下 载 到 浏览 器 中 在 本 地 运行 ,而 servlet 则 从 本 地 上 传 到 服务 器 ( 常 为 
Web 服务 器 ) 在 远程 运行 。 

移动 Agent(Mobile Agent,MA) 一 一 代码 点 用 模式 的 移动 不 是 自主 的 ,而 且 代 码 不 
能 多 次 移动 。MA 可 以 (在 一 定 范围 内 ) 随 意 移动 到 能 提供 服务 的 目标 主机 上 ,可 以 连续 
移动 ,而 且 这 种 移动 是 自主 的 。 在 MA 模式 中 ,原来 C/S 模式 中 的 客户 和 服务 器 的 界限 
消失 了 ,取而代之 的 是 统一 的 “主机 ”的 概念 ;原来 代码 点 用 模式 中 的 代码 具有 了 自主 性 ， 
而 且 可 以 进行 多 次 移动 ,典型 地 ,Java 中 的 applet 和 servlet 被 统一 成 移动 Agent。 这 样 
的 MA 有 其 明显 的 优势 。 

第 一 ,MA 技术 能 较 大 地 减少 网 络 上 的 数据 流量 。 通 过 将 服务 请 求 Agent 移动 到 目 
标 主 机 ,使 该 MA 直接 访问 该 主机 上 的 资源 ,与 源 主机 只 有 较 少 的 交互 ,从 而 避免 了 大 量 
数据 的 网 络 传送 ,降低 了 系统 对 网 络 带宽 的 依赖 ;同时 也 缩短 了 通信 延 时 ,提高 了 服务 响 

第 二 ,MA 能 以 异步 的 方式 自主 运行 。 我 们 可 以 将 要 完成 的 任务 苦 入 到 MA 中 ,并 
通过 网 络 将 其 派出 去 ,然后 就 可 以 断 开源 主机 与 目标 主机 的 连接 。 此 后 ,MA 就 独立 于 最 
初生 成 它 的 进程 ,可 以 异步 自主 地 运行 了 。 源 主机 可 以 在 随后 适当 的 时 候 再 与 目标 主机 
连接 并 接收 运行 的 结果 信息 。 这 对 于 移动 设备 或 移动 用 户 来 说 尤其 有 用 。 移 动 计算 的 真 
正 意义 也 在 于 此 。 

第 三 ,MA 可 以 根据 服务 器 和 网 络 的 负载 动态 决定 移动 目标 ,有 利于 负载 均衡 。 而 
且 ,MA 的 智能 路 由 减少 了 用 户 浏览 或 搜寻 时 的 判断 。 

第 四 ,在 进行 任务 处 理 时 ,可 通过 动态 创建 多 个 Agent 并 行 工作 ,提高 效率 ,并 降低 
对 任务 的 响应 时 间 。 

第 五 ,能 够 克服 网 络 隐患 ,在 不 可 靠 的 网 络 中 也 能 提供 稳定 的 服务 。 例 如 ,在 远程 工 
业 实 时 控制 系统 中 ,通过 存在 隐患 的 网 络 传送 控制 信息 , 远 不 如 将 控制 指令 通过 MA 直 
接 移动 到 该 受 控 系 统 上 执行 安全 。 

2. 移动 Agent 是 Internet 发 展 的 趋势 

移动 Agent 的 产生 是 众多 因素 的 综合 结果 。Internet 上 信息 的 数量 以 及 上 网 用 户 的 
数量 和 种 类 在 飞速 增长 。 这 些 用 户 来 自 不 同 的 民族 和 地 域 , 有 不 同 的 文化 和 知识 背景 ,他 
们 对 Internet 上 信息 的 需求 以 及 希望 使 用 Internet 的 方式 也 是 不 同 的 ,这 就 要 求 对 
Internet 进行 个 性 化 的 表示 和 使 用 。 这 种 个 性 化 可 能 只 是 表示 格式 的 不 同 , 也 可 能 是 诸 
如 信息 自动 搜索 .邮件 过 滤 等 更 高 级 的 要 求 ,它们 体现 在 Internet 的 实现 中 ,也 就 是 服务 
的 客户 化 。 这 种 服务 的 客户 化 可 以 直接 在 服务 器 端 实现 ,也 可 以 通过 代理 服务 器 (proxy) 
实现 。 

尽管 目前 Internet 的 带宽 不 断 增 大 ,但 其 发 展 速度 还 是 跟 不 上 Internet 上 通信 量 的 
飞速 增长 ,网 络 带宽 仍然 是 制约 Internet 用 户 的 一 个 主要 因素 。 

目前 计算 机 工业 发 展 的 一 个 热点 是 移动 设备 。 这 些 设备 多 数 通过 Internet 进行 互 
联 , 这 时 它们 也 要 求 避免 大 量 数据 传输 。 设 备 互 连 可 以 采用 proxy 的 方法 ,也 可 以 采用 客 
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户 端的 移动 代码 技术 。 后 者 的 典型 代表 是 Java 的 applet, 通 过 applet 在 本 地 与 客户 进行 
复杂 、 耗 时 的 交互 ,然后 传输 结果 ,这 种 方法 更 为 有 效 。 将 这 里 的 移动 代码 赋予 自主 性 后 
就 变 成 了 移动 Agent。 

但 网 络 服 务 不 可 能 完全 满足 不 同 用 户 的 各 种 个 性 化 需求 ,而 且 随 着 用 户 的 增多 ， 
proxy 也 会 变 为 通信 的 瓶颈 。 一 种 解决 方法 是 以 移动 代码 的 形式 实现 这 些 个 性 化 的 工 
有 具 ,这 些 移动 代码 可 以 按 用 户 的 要 求 移动 到 相应 的 服务 器 或 proxy 上 ,甚至 可 以 移动 到 客 
户 机 上 。 移 动 代码 方法 还 可 以 在 通信 双方 连接 断 开 的 情况 下 继续 工作 。 

用 户 在 网 络 上 搜索 信息 时 不 可 能 在 一 台 服 务 器 上 就 能 得 到 全 部 信息 ,他 们 往往 要 搜 
索 多 台 主 机 。 为 避免 大 的 延迟 ,就 要 避免 “ 星 形 的 循环 ”, 即 移动 代码 首先 进入 第 一 个 网 址 
进行 搜索 并 将 结果 返回 客户 ,然后 同样 的 或 不 同 的 移动 代码 又 从 客户 端 出 发 进入 第 二 个 
选 定 的 网 址 …… 如 此 进行 ,直到 用 户 找到 所 需 的 信息 。 如 果 让 移动 代码 携带 用 户 的 搜索 
要 求 ,在 第 一 个 网 址 搜索 完毕 后 直接 移动 到 第 二 个 网 址 .第 三 个 网 址 …… 直到 找到 用 户 所 
需 的 信息 , 则 可 以 极 大 地 减少 网 络 拥挤 ,提高 搜索 速度 。 这 种 可 以 连续 多 次 移动 的 代码 就 
是 移动 Agent。 





6.6.2 定义 和 系统 组 成 


移动 Agent 是 具有 移动 特性 (mobility) 的 智能 Agent, 它 可 以 自主 地 在 网 络 上 从 一 台 
主机 移动 到 另 一 台 主 机 ,并 代表 用 户 完成 指定 的 任务 ,如 检索 、 过 滤 和 收集 信息 ,甚至 可 以 
代表 用 户 进行 商业 活动 。MA 技术 是 分 布 式 技术 与 Agent 技术 相 结 合 的 产物 , 它 除 了 具 
有 智能 Agent 的 最 基本 特性 一 一 反应 性 、 自 主 性 、 主 动 性 和 交互 性 外 ,还 具有 移动 性 。 

不 同 的 移动 Agent 系统 的 体系 结构 各 不 相同 ,但 几乎 所 有 的 移动 Agent 系统 都 包括 
如 下 两 部 分 : Agent 和 MA 环境 (MAE 或 称 MA 服务 器 .MA 主机 (MAH)、MA 服务 设 
施 、Place、Context、Location) ,如 图 6-16 所 示 。 





@ 移动 Agent 


服务 Agent 表 
A 


呈 一 >》 移动 
一 一 本 地 通信 / 
一 -一 远程 通信 
























i 黄页 服务 
| 文件 服务 

















6-16 ”移动 Agent 系统 


MA 环境 (MAE) 为 Agent 提供 安全 、 正 确 的 运行 环境 ,实现 MA 的 移动 .MA 执行 状 
态 的 建立 .MA 的 启动 ,实施 MA 的 约束 机 制 、 容 错 策略 .安全 控制 .通信 机 制 , 并 提供 基 


务 6 葛 4sent 一 267 


本 服务 模块 ,如 事件 服务 (event service) 、 黄 页 服务 (yellow page service) .事务 处 理 服务 
(transaction service) 和 域名 服务 (DNS) 等 。 一 台 主 机 上 可 以 有 一 个 或 多 个 MAE。 通 常 
情况 下 ,一 个 MAE 只 位 于 一 台 主 机 上 ,但 当主 机 之 间 是 以 高 速 持续、 稳定 可 靠 的 网 络 连 
接 时 ,一 个 MAE 可 以 跨越 多 台 主 机 而 不 影响 整个 系统 的 运行 效率 。 

Agent 可 以 分 为 移动 Agent( 也 称 用 户 Agent,User Agent) 和 服务 Agent( 也 称 系统 
Agent(System Agent) 或 静态 Agent(Static Agent) ) 。 

移动 Agent 可 以 从 一 个 MAE 移动 到 另 一 个 MAE, 在 MAE 中 执行 ,并 通过 通信 机 
制 与 其 他 MA 通信 或 访问 MAE 提供 的 服务 。 

服务 Agent 不 具有 移动 的 能 力 , 其 主要 功能 是 向 本 地 的 Agent 或 来 访 的 Agent 提供 
服务 。 通 常 ,一 个 MAE 上 驻 有 多 个 服务 Agent, 分 别提 供 不 同 的 服务 ,如 文件 服务 、 黄 页 
服务 等 系统 级 服务 , 订 票 服务 .数据库 服务 等 应 用 级 服务 。 由 于 系统 Agent 是 不 移动 的 ， 
并 且 只 能 由 它 所 在 MAE 的 管理 员 启 动 和 管理 ,因此 保证 服务 Agent 不 会 是 “恶意 的 ”。 
来 访 的 移动 Agent 不 能 直接 访问 系统 资源 ,只 能 通过 服务 Agent 提供 的 接口 访问 * 受 控 
制 的 (controlled)” 安 全 (secure)” 的 服务 ,这 可 以 避免 恶意 的 Agent 对 主机 的 攻击 ,是 移 
动 Agent 系统 经 常 采用 的 安全 策略 。 另 外 ,采用 Java 提供 的 C 语言 接口 (C-Interface)， 
服务 Agent 可 以 提供 与 遗留 软件 (legacy software) 的 交互 接口 ,很 容易 将 非 Agent 系统 
集成 到 Agent 系统 中 。 


6.6.3 实现 技术 


移动 Agent 技术 提供 了 一 个 能 同时 满足 如 下 要 求 的 体系 框架 : 四 减轻 网 络 负载 , 节 
省 网 络 带宽 ; 四 支持 实时 远程 交互 ; 四 封装 网 络 协议 ; 四 支持 异步 自主 执行 ; @ 支 持 离 
线 计算 ; @ 支 持平 台 无 关 性 ; 具有 动态 适应 性 ; @ 提 供 个 性 化 服务 ; @ 回 增强 应 用 的 强 
壮 性 和 容错 能 力 。 

移动 Agent 技术 涉及 通信 ,分布 式 系 统 、 操 作 系 统 、 计 算 机 网 络 、 计 算 机 语言 以 及 分 
布 式 人 工 智 能 等 诸多 领域 ,为 了 更 好 地 利用 移动 Agent 技术 ,必须 解决 好 以 下 关键 技术 
问题 。 

1. 移动 

移动 (migration) 可 分 为 强 移 动 和 弱 移 动 两 种 。 移 动 Agent 包括 3 种 状态 : 程序 状态 
(program state) ,数据 状态 (data state) 和 执行 状态 (execution state)。 程 序 状态 指 所属 
Agent 的 实现 代码 ;数据 状态 包含 全 局 变量 和 Agent 的 属性 ;执行 状态 包含 局 部 变量 值 、 
函数 参数 值 和 线程 状态 等 。 强 移动 包含 程序 状态 .数据 状态 和 执行 状态 的 移动 ,而 弱 移 动 
只 包含 程序 状态 和 数据 状态 的 移动 。 

强 移动 的 语义 是 : 在 移动 目的 地 ,从 Agent 的 断 点 处 执行 。 如 果 MA 包含 多 个 线程 ， 
则 多 个 线程 同时 从 断 点 处 运行 。 强 移动 要 求 Agent 的 实现 语言 提供 Agent 执行 状态 的 
外 表 化 (externalize) 和 内 在 化 (internalize) 的 功能 , 即 要 求 MA 系统 提供 抽取 (extraction) 
执行 状态 ,恢复 (re-insertion) 执 行 状 态 的 功能 。 目 前 只 有 少数 语言 能 提供 上 述 要 求 的 功 
能 ,如 Facile 和 Tycoon。 由 于 Agent 的 执行 状态 通常 很 庞大 (尤其 对 多 线程 Agent) ,所 
以 强 移动 是 开销 很 大 的 操作 。AgentTCL、Ara 和 Telescript 都 属于 强 移动 系统 。 
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弱 移 动 只 携带 程序 状态 和 数据 状态 ,根据 需要 只 把 MA 的 部 分 执行 状态 存 人 数据 状 
态 中 随 Agent 一 起 移动 ,传输 的 数据 量 有 限 ; 弱 移 动 操作 的 开销 小 ,执行 效率 高 ,但 它 改 
变 了 移动 后 的 执行 语义 。MA 移动 到 新 主机 后 ,不 再 接着 移动 前 的 断 点 处 执行 ,而 是 执行 
主线 程 的 某 一 个 人 口 函 数 ( 如 在 系统 MOLE 中 是 主线 程 的 start 方法 ,在 系统 Aglets 中 
是 主线 程 的 run 方法 ) 。 在 该 函数 中 ,根据 数据 状态 决定 应 该 如 何 执行 。 如 果 Agent 包含 
多 个 线程 , 则 移动 之 后 ,只 启动 包含 入 口 函 数 的 线程 ,再 由 它 决 定 启动 哪些 线程 。Aglets、 
Mole 和 Odyssey 都 是 弱 移动 系统 。 

移动 Agent 为 完成 用 户 指 定 的 任务 ,通常 要 依次 移动 到 多 个 主机 上 ,依次 与 这 些 主 
机 交互 ,并 使 用 其 提供 的 服务 和 资源 ,这 就 是 所 谓 的 Multi-Hop 技术 。 如 何 实现 和 规划 
MA 在 多 主机 间 的 移动 是 移动 机 制 和 移动 策略 所 要 解决 的 问题 。 

移动 机 制 主要 研究 移动 的 实现 方式 。 不 同 的 系统 采用 的 移动 机 制 不 同 ,目前 MA 的 
移动 机 制 可 以 分 为 两 大 类 : 一 类 是 将 MA 的 移动 路 线 、 移 动 条 件 隐 含 在 MA 的 任务 代码 
中 ,其 代表 系统 是 IBM 的 Aglet; 另 一 类 是 将 MA 的 移动 路 线 ,移动 条 件 从 MA 的 任务 代 
人 码 中 分 离 ,用 所 谓 的 “旅行 计划 ”表示 ,其 代表 系统 是 Mitsubishi 公司 的 Concordia。 

MA 的 移动 策略 是 指 根据 MA 的 任务 、 当 前 网 络 负载 和 服务 器 负载 等 外 界 环境 , 动 
态 地 为 其 规划 出 移动 路 径 , 使 MA 在 开销 最 小 的 情况 下 最 快 .最 好 地 完成 其 任务 。 移 动 
策略 的 优 劣 直接 影响 MA 的 性 能 ,乃至 其 任务 的 完成 。 移 动 策略 一 般 可 以 分 为 静态 路 由 
策略 和 动态 路 由 策略 。 在 静态 路 由 中 ,需要 访问 的 主机 和 访问 的 次 序 在 MA 执行 任务 之 
前 就 已 经 由 MA 的 设计 者 确定 了 。 在 动态 路 由 中 ,访问 哪些 主机 及 访问 的 次 序 在 MA 的 
任务 执行 之 前 是 无 法 预料 的 ,由 MA 根据 任务 的 执行 情况 自主 决定 ,一 般 由 用 户 指定 一 
个 初始 路 由 表 ,MA 在 按照 该 路 由 表 移 动 的 过 程 中 可 以 根据 周围 环境 的 变化 自主 修改 路 
由 表 。 动 态 路 由 方式 体现 出 MA 的 自主 性 、 反 应 性 。 

目前 ,MA 的 移动 机 制 的 研究 比较 广泛 和 深入 , 相 比 之 下 ,有 关 MA 移动 策略 研究 还 
比较 少 ,未 见 有 系统 对 MA 移动 策略 给 出 一 个 较为 精确 和 系统 的 说 明 。 多 数 系统 在 规划 
MA 移动 路 由 时 只 考虑 了 软件 资源 (任务 语义 ) ,而 忽略 了 网 络 传输 资源 和 主机 处 理 资源 
等 硬件 资源 的 影响 ,更 没有 考虑 MA 以 往 的 旅行 经 验 , 这 显然 是 不 全 面 的 。IBM 的 Aglet 
给 出 了 移动 Agent 传输 协议 (ATP) ,但 该 协议 只 是 规定 了 MA 在 两 台 主机 之 间 如 何 传 
输 , 并 没有 考虑 硬件 资源 对 移动 路 由 的 影响 ,也 没有 给 出 MA 在 多 个 主机 之 间 的 移动 策 
略 。Acharya 等 意识 到 不 同 硬件 资源 及 其 使 用 状况 对 MA 移动 的 影响 ,但 在 实现 MA 系 
统 Sumatra 时 只 给 出 了 网 络 延 迟 的 监测 ,而 没有 考虑 到 目标 主机 本 地 资源 对 Agent 移动 
的 具体 影响 。D. Rus 等 人 在 对 网 络 负载 进行 监测 的 基础 上 ,进一步 给 出 了 对 网 络 连接 和 
目标 主机 是 否 可 达 等 监测 信息 ,但 也 忽略 了 目标 主机 本 地 资源 对 Agent 移动 的 具体 影 
响 。Concordia 提出 了 旅行 计划 的 概念 .实现 了 迁移 信息 和 Agent 任务 体 的 分 离 , 但 其 旅 
行 计划 的 描述 能 力 和 灵活 性 都 不 够 ,不 能 表达 多 种 迁移 方式 。 另 外 , 它 只 是 从 任务 语义 的 
角度 决定 MA 下 一 步 向 哪里 移动 ,但 还 不 能 根据 网 络 资源 .目标 主机 资源 动态 地 规划 
MA 的 移动 路 径 。Dartmouth 学 院 的 K. Moizumi 等 人 在 DAgent 的 基础 上 开发 了 分 布 
式 信息 查询 系统 Technical-Report Searcher, 在 该 系统 中 他 们 将 移动 策略 称 之 为 旅行 代 
理 问 题 (Traveling Agent Problem,TAP)。 在 他 们 的 解决 方案 中 ,综合 考虑 了 网 络 负载 、 
主机 负载 和 主机 上 存在 所 查 信息 的 概率 等 因素 ,力图 在 MA 出 发 之 前 为 其 规划 出 一 条 最 
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佳 移动 路 径 ,使 MA 完成 任务 的 时 间 最 短 。TAP 实际 上 是 静态 路 由 问题 ,在 他 们 提出 的 
“贪心 算法 (greed method) "中 没有 考虑 负载 信息 过 时 对 算法 的 影响 。 该 系统 采用 一 个 
“网 络 感知 模块 (network-sensing module) ”获得 网 络 负载 信息 和 主机 负载 信息 ,存在 集中 
环节 。 另 外 ,在 “最 佳 ” 的 评判 标准 上 ,也 只 考虑 了 速度 ,而 没有 考虑 服务 价格 和 服务 质量 。 

2. 通信 

移动 Agent 系统 可 采用 的 通信 手段 很 多 ,有 消息 传递 .RPC、RMI\ 匿 名 通信 和 Agent 
通信 语言 等 。 根 据 通信 对 象 的 不 同 ,移动 Agent 的 通信 方式 可 分 为 以 下 几 种 。 

(1) 移动 Agent/ 服 务 Agent 通信 : 该 通信 方式 实质 是 移动 Agent 和 MAE 之 间 的 通 
信 。 服 务 Agent 提供 服务 ,移动 Agent 请 求 服务 ,是 一 种 典型 的 客户 /服务 器 模式 ,如 移 
动 Agent 向 黄页 服务 Agent 查询 有 关 服 务 。 该 类 通信 方式 可 以 采用 类 似 RPC、RMI 的 
通信 机 制 。 

(2) 移动 Agent/ 移 动 Agent 通信 : 这 是 对 等 (peer-to-peer) 通 信和 方式 ,通信 双方 的 地 
位 是 平等 的 。 为 了 完成 特定 的 任务 ,如 协作 求解 ,移动 Agent 系统 必须 提供 同步 和 异步 
通信 机 制 。 

(3) 组 通信 : 也 称 为 匿名 通信 。 前 两 种 通信 方式 的 前 提 是 ,通信 双方 事先 相互 了 解 。 
然而 ,在 某 些 情况 下 ,通信 的 双方 并 不 能 确认 对 方 的 身份 。 例 如 ,在 基于 移动 Agent 技术 
的 分 布 式 信息 查询 应 用 中 ,一 组 Agent 被 派 遗 到 Internet 的 各 个 信息 源 上 执行 搜索 操作 ， 
在 查询 的 过 程 中 ,为 了 提高 搜索 的 并 行 度 , 某 些 Agent 可 能 又 派生 多 个 子 Agent 组 , 当 这 
些 子 Agent 和 其 父 Agent 所 在 组 中 的 Agent 进行 通信 时 ,就 是 匿名 通信 。 在 组 通信 方式 
中 ,通信 的 一 方 只 能 确定 对 方 所 在 的 组 ,而 不 能 确定 组 中 具体 的 成 员 。 目 前 支持 组 通信 的 
方法 有 组 通信 协议 (group communication protocols), 如 ISIS; 共享 内 存 (shared 
memory) ,如 Tuple Spaces; 事 件 管理 等 。 在 事件 管理 方式 中 ,Agent 向 系统 注册 其 感 兴 
趣 的 事件 , 当 其 他 Agent 产生 该 事件 时 , 交 由 注册 Agent 处 理 。 

(4) 移动 Agent/ 用 户 通信 : 属于 智能 人 机 接口 领域 。 

根据 通信 发 生 的 地 点 ,可 以 把 通信 分 为 本 地 通信 (又 称 结 点 内 通信 ,主机 内 通信 
(inter-place communication) 和 远程 通信 (又 称 结 点 间 通 信 , 网络 通信 , intra-place 
communication) 。 通 常 ,一 个 主机 内 不 同 MAE 之 间 的 通信 被 视 为 远程 通信 。 

Agent 通信 语言 (ACL) 是 实现 MA 与 MA 执行 环境 ,以 及 MA 与 MA 之 间 通 信 的 高 
级 方式 。 开 放 式 MA 系统 的 ACL 系统 应 当 具 有 环境 无 关 、 简 洁 、 语 法 语义 一 致 等 特点 。 
KQML/KIF 和 XML 是 两 种 具有 发 展 潜力 的 通信 语言 (或 协议 ) ,前 者 主要 用 于 知识 处 理 
领域 ,后 者 在 Internet 环境 (尤其 是 WWW) 中 具有 很 好 的 支持 能 力 。 

在 具体 的 移动 Agent 系统 中 ,通信 的 实现 方式 有 很 大 差别 。Tacoma 通过 一 个 携带 
数据 的 briefcase 交换 数据 。Ara 支持 C/S 方式 的 服务 调用 ,但 没有 提供 异地 Agent 之 间 
的 通信 手段 。Telescript 中 的 Agent 只 能 在 相遇 点 (Meet Place) 中 使 用 本 地 方法 调用 的 
方式 相互 通信 。D’?Agent 既 支 持 底层 的 消息 传递 方式 ,也 支持 高 层 通信 方式 ,如 Agent 
RPC 和 KQMLVKIF。Aglets,Mole,Voyage 等 基于 Java 的 系统 通常 采用 Java 对 象 实现 
分 布 式 事件 通信 和 消息 传递 机 制 。 另 外 ,Aglets 预 留 了 与 CORBAVIIOP 的 通信 接口 。 

3. 程序 设计 语言 

移动 Agent 系统 对 程序 设计 语言 有 多 方面 的 要 求 。Knabe 等 人 对 移动 Agent 的 程 
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序 设计 语言 提出 4 条 基本 要 求 。 

(1) 支持 移动 : 该 语言 必须 提供 机 制 ,以 确定 将 要 移动 的 Agent 应 携带 哪些 代码 ; 必 
须 提供 发 起 “移动 ”操作 的 原 语 或 函数 。 

(2) 支持 异 构 性 : 用 该 语言 编写 的 移动 Agent 应 当 能 在 一 个 异 构 的 环境 中 任意 移 
动 , 这 个 异 构 的 环境 可 能 包含 不 同 拓扑 结构 的 网 络 、 不 同类 型 的 计算 机 硬件 设备 ,不 同 的 
操作 系统 等 。 

(3) 高 性 能 : 移动 Agent 的 移动 操作 会 给 系统 带 来 很 大 的 开销 。 在 某 些 情况 下 , 移 
动 Agent 的 执行 效率 甚至 远 低 于 其 他 技术 。 该 语言 必须 能 快速 高 效 地 运行 。 

(4) 安全 性 好 : 该 语言 必须 具有 很 好 的 安全 性 ,使 用 该 语言 编写 的 移动 Agent 不 易 
受到 恶意 主机 和 其 他 恶意 Agent 的 攻击 。 

MA 的 实现 语言 可 以 采用 编译 型 语言 ,也 可 以 采用 解释 型 语言 。 从 支持 移动 、 支 持 异 
构 性 、 执 行 效率 和 安全 性 等 多 方面 考虑 ,几乎 所 有 的 移动 Agent 系统 都 采用 解释 型 语言 。 
由 于 Java 技术 的 快速 发 展 和 其 具有 良好 的 安全 性 和 较 高 的 执行 效率 ,因而 被 大 多 数 移动 
Agent 系统 所 采用 。 

如 果 采 用 编译 型 语言 ,MA 被 编译 成 本 地 代码 (native code) ,本 地 代码 与 具体 的 系统 
平台 有 关 , 当 MA 在 不 同系 统 平台 之 间 移 动 时 ,必须 重新 编译 源 代码 。 另 外 ,本 地 代码 具 
有 直接 访问 本 地 系统 资源 的 权利 ,使 得 很 难 进行 安全 控制 。 如 果 采 用 解释 型 语言 ,MA 被 
编译 成 与 本 地 无 关 的 独立 于 机 器 的 代码 (machine-independent code) ,由 解释 器 解释 执 
行 , 不 同 平台 上 的 解释 器 能 保证 MA 可 以 在 不 同系 统 平台 之 间 移 动 执行 ,并 且 解 释 器 在 
解释 执行 时 ,对 访问 系统 资源 的 语句 加 以 严格 控制 ,实现 语言 级 安全 性 。 

当选 用 解释 型 语言 作为 Agent 的 实现 语言 时 ,所 面临 的 问题 是 执行 效率 。 编 译 后 的 
本 地 代码 其 执行 比 解释 执行 速度 快 ,但 目前 有 些 解 释 型 语言 提供 实时 编译 技术 (如 Java 
语言 的 Just-In-Time 技术 ) 可 以 显著 地 提高 解释 型 语言 的 执行 速度 。 

从 移动 语义 考虑 ,如 果 提 供 强 移动 (strong migration), 需 要 获得 MA 的 执行 状态 
(execution state)。 对 于 解释 执行 而 言 ,要 求解 释 器 提供 抽取 (extraction) 线 程 执 行 状态 、 
恢复 (re-insertion) 线 程 执行 状态 的 功能 。 对 采用 编译 执行 而 言 ,线程 的 执行 状态 用 堆栈 
表示 ,编译 器 必须 提供 捕捉 堆栈 和 恢复 堆栈 的 功能 ,目前 的 移动 Agent 系统 即使 采用 的 
是 同一 种 编译 器 ,该 过 程 开 销 也 十 分 巨大 。 

解释 性 语言 还 具有 延迟 绑 定 的 优点 ,程序 可 以 包含 本 地 不 存在 的 函数 和 类 ,这 很 好 地 
支持 了 代码 的 移动 。 

不 同 的 移动 Agent 系统 采用 不 同 的 语言 ,大 体 可 以 分 为 多 语言 系统 和 单 语 言 系统 。 
多 语言 系统 的 代表 有 Ara、Tacoma 和 D’”Agent。Ara 致力 于 用 当前 现 有 的 编程 语言 实现 
移动 Agent, 支 持 C/C++ 、Tcl、Java; Tacoma 支持 Tcl/Tk、C、Scheme、Perl 和 Python。 
D’” Agent 支持 Tcl、Scheme 和 Java。 单 语言 系统 多 数 采 用 Java, 如 Mole、 Aglet、 
Concordia、Voyager 等 。DEC 研究 院 研制 的 Oblic 采用 面向 对 象 语言 Oblic。 编 程 语言 
的 选择 对 于 移动 Agent 系统 的 发 展 至 关 重 要 ,第 一 个 商业 化 的 移动 Agent 系统 
Telescript 的 消亡 就 说 明了 这 一 点 ,过 于 专用 的 Telescript 语言 极 大 地 限制 了 Telescript 
系统 应 用 范围 ,使 之 无 法 经 受 基于 Java 的 移动 Agent 系统 冲击 。General Magic 公司 重 
新 开发 了 一 个 基于 Java 版 本 的 移动 Agent 系统 Odyssey,Odyssey 继承 了 Telescript 的 
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所 有 思想 。 

4. 安全 性 

MA 的 移动 性 会 带 来 很 多 不 确定 因素 ,要 想 使 MA 被 广泛 地 接受 ,成 功 地 应 用 于 商 
业 ( 如 电子 商务 ) ,就 必须 解决 好 MA 的 安全 性 (security) 问 题 。MA 的 安全 性 问题 是 MA 
成 功 应 用 的 瓶颈 ,是 移动 Agent 系统 中 最 重要 、 最 复杂 的 问题 。 

通常 把 移动 Agent 系统 的 安全 问题 分 为 4 个 部 分 : 四 保护 主机 免 受 恶 意 Agent 的 攻 
击 ; 四 保护 Agent 免 受 恶意 主机 的 攻击 ; 四 保护 Agent 免 受 其 他 恶意 Agent 的 攻击 ; 
@ 保 护 低层 传输 网 络 的 安全 。 

为 了 阻止 恶意 MA 对 主机 的 破坏 ,在 主机 上 通常 采用 如 下 安全 检测 技术 。 

(1) 身份 认证 (Cauthentication) : 它 主要 用 于 检查 MA 是 否 来 源 于 可 信和 的 地 方 。 这 需 
要 从 MA 的 源 主机 或 独立 的 第 三 方 将 有 关 身 份 认证 的 详细 信息 传送 过 来 。 身 份 认证 失 
败 的 MA 或 者 被 驱逐 出 主机 ,或 者 仅 允许 以 匿名 Agent 的 身份 在 十 分 有 限 的 资源 环境 下 
运行 。 数 字 签 名 就 是 一 种 常用 的 身份 认证 技术 。 

(2) 代码 验证 (verification) : 它 主要 用 于 检查 MA 的 代码 ,看 它 是 否 会 执行 被 禁止 的 
动作 。 由 于 有 些 代码 只 有 在 其 被 执行 时 才能 被 验证 ,如 用 于 函数 参数 的 变量 的 内 容 等 ,所 
以 代码 验证 常常 按 如 下 步骤 进行 : 首先 检查 MA 是 否 试图 破坏 其 执行 环境 ,然后 检查 该 
MA 实际 运行 所 在 的 MA 系统 是 否 对 MA 的 管理 负责 。 若 以 上 验证 结果 成 立 , 则 进一步 
检查 该 Agent 的 操作 是 否 超 出 其 授权 和 资源 限制 的 范围 。 可 以 采用 一 种 称 为 携带 证 明 
的 代码 (proof-carrying code) 完 成 对 来 自 不 安全 地 点 的 移动 代码 的 验证 ,以 确定 对 该 代码 
的 执行 是 否 安全 。 该 技术 将 安全 性 证 明 (proof) 附加 到 每 条 代码 上 并 与 代码 一 块 移动 。 
目标 主机 可 以 迅速 验证 这 些 证 明 并 进而 判定 移动 代码 的 安全 性 。 证 明 或 代码 两 者 之 一 被 
窜改 均 会 造成 整个 代码 验证 失败 ,从 而 导致 移动 代码 被 拒绝 执行 。Java 语言 本 身 提供 了 
一 定 程 度 的 代码 验证 机 制 , 即 完整 性 验证 。 

(3) 授权 认证 (authorization) : 主要 检查 MA 对 主机 资源 的 各 种 访问 许可 ,这 包括 资 
源 可 被 访问 的 次 数 和 被 使 用 的 数量 以 及 MA 在 该 资源 上 进行 存 取 操作 的 类 型 。 例 如 ,被 
高 度 信任 的 MA 可 以 读 、 写 ,修改 指定 的 资源 并 可 无 限制 地 访问 它 ; 而 不 被 信任 的 MA 则 
仅 能 对 该 资源 进行 读 操作 ,而 且 只 能 进行 有 限 次 的 访问 。 有 些 MA 可 能 允许 访问 主机 的 
计算 资源 ;有 些 MA 则 可 能 被 完全 禁止 。 可 以 通过 使 用 访问 控制 表 的 方法 实现 授权 
认证 。 

(4) 付费 检查 (payment for services) : 它 主要 用 于 检查 MA 对 服务 的 付费 意愿 和 付 
费 能 力 ( 除 非 服 务 是 免费 的 ) ,这 包括 检查 MA 是 否 确 实 付 费 了 、 付 费 过 程 是 否 正 确 以 及 
付费 者 是 否 对 所 提供 的 服务 满意 等 。MA 在 运行 的 过 程 中 至 少 会 使 用 服务 器 的 计算 资 
源 , 也 可 能 进行 购买 物品 的 交易 。 为 避免 不 必要 的 资源 占用 和 不 合理 的 交易 ,需要 限制 
MA 的 权利 ,这 也 可 以 通过 付费 的 方式 控制 。 例 如 ,MA 可 以 携带 一 定数 量 的 电子 货币 ， 
当 MA 在 某 主机 上 运行 时 , 它 需要 根据 所 要 求 的 服务 的 数量 和 质量 对 主机 付费 。 这 样 ， 
MA 的 权利 受 限于 其 所 拥有 的 货币 的 多 少 , 用 尽 货币 的 MA 会 消亡 。 当 然 ,MA 会 要 求 主 
机 不 能 随意 捏造 收 到 的 货币 数量 ,而 且 要 求 主机 确实 提供 了 双方 所 协商 的 服务 。 

通过 上 面 给 出 的 4 种 方法 ,主机 的 安全 性 问题 在 一 定 程 度 上 可 以 解决 ,但 有 关 MA 
方面 的 安全 问题 还 需要 考虑 , 即 要 保证 MA 在 传送 和 远程 执行 时 的 安全 和 完整 。 为 保证 








pp 人 元 花 ( 弟 3 族 ) 


MA 在 传送 和 远程 执行 时 的 安全 性 和 完整 性 ,通常 采用 加 密 技术 、 身 份 认 证 技术 (如 数字 
签名 ) 等 。 采 用 诸如 PGP 等 加 密 算 法 有 助 于 在 MA 传送 过 程 中 保护 其 内 容 免 遭 窍 听 。 
使 用 身份 认证 技术 可 用 于 检查 目标 主机 的 合法 性 ;数字 签名 技术 还 可 用 于 验证 信息 ,保证 
接收 者 不 算 改 收 到 的 信息 ,并 使 处 理 结 果 返 回 到 正确 的 发 送 者 。 

对 于 MA 的 安全 性 问题 ,很 多 学 者 做 出 了 大 量 的 工作 ,但 多 数 是 针对 具体 的 系统 和 
环境 ,而 且 只 侧重 于 某 一 层面 。 例 如 ,ffMAIN 利用 其 实现 语言 SafeTCL 在 安全 性 方面 
的 特点 重点 给 出 了 代码 验证 的 实现 方法 ;APRIL 重点 研究 代码 验证 和 加 密 技术 而 忽略 了 
其 他 因素 ;基于 Java 语言 的 系统 ,在 代码 验证 方面 往往 直接 使 用 Java 的 字 节 码 校 验 程序 
而 很 少 再 对 此 做 深入 研究 ,但 Java 的 字 节 码 校 验 程 序 本 身 还 存在 一 定 的 缺陷 。 

作为 第 一 个 商业 化 的 MA 系统 ,General Magic 的 Telescript 对 安全 性 策略 进行 了 细 
致 的 设计 , 它 提 供 了 本 节 提 到 的 各 种 安全 机 制 。IBM 的 Aglets 也 是 面向 商用 目的 , 它 提 
供 了 身份 验证 ,授权 认证 .代码 验证 以 及 电子 货币 机 制 。Agent TCL 对 安全 性 有 较 好 的 
支持 ,缺憾 的 是 没有 提供 有 关 付 费 检查 功能 。APRIL 在 代码 验证 方面 很 有 特色 (这 与 其 
使 用 专用 语言 April 有 关 ) ,但 未 阐明 其 传输 的 安全 性 问题 。Mole 和 Sumatra 除了 利用 
Java 已 有 的 安全 机 制 ( 代 码 验证 ) 和 默认 的 安全 管理 器 外 ,没有 再 提供 其 他 的 安全 机 制 。 

5. 容错 

为 保证 移动 Agent 在 异 质 环境 中 正常 运行 ,必须 考虑 到 服务 器 异常 .网 络 故 障 、 目 标 
主机 关机 , 源 主机 长 时 间 无 响应 等 异常 情况 的 出 现 ,并 给 出 相应 的 解决 方法 。MA 要 执行 
的 任务 越 复杂 ,经 过 或 所 到 达 的 站 点 越 多 , 则 出 现 故 障 的 概率 也 就 越 大 。 在 诸如 Internet 
这 样 的 广域网 环境 中 ,此 概率 是 绝对 不 容 忽 略 的 。 像 安全 性 一 样 ,容错 性 (fault- 
tolerance) 也 是 移动 Agent 系统 成 功 应 用 所 需 重点 解决 的 问题 。 

在 MA 的 移动 和 任务 求解 过 程 中 ,有 以 下 几 个 环节 可 能 产生 系统 错误 。 

(1) 传输 过 程 : MA 是 在 网 络 上 进行 移动 ,网 络 传 输 介质 的 不 稳定 和 高 误 码 率 常常 会 
导致 传输 的 错误 ,线路 的 中 断 还 会 导致 MA 的 崩溃 。 

(2) MA 服务 环境 : MA 会 在 不 同 的 计算 机 系统 中 运行 ,这 些 计 算 机 系统 的 容错 能 力 
可 能 各 不 相同 。 当 MA 服务 环境 出 现 主机 进行 恶意 破坏 ,或 主机 长 时 间 停 机 ,或 系统 死 
机 ,或 系统 掉 电 等 情况 时 ,都 能 造成 MA 的 失效 或 崩溃 。 

(3) MA 自身 代码 : MA 设计 和 实现 的 缺陷 也 会 导致 MA 系统 突然 崩溃 。 

MA 在 结 点 间 移 动 和 执行 的 过 程 是 典型 的 串 行 过 程 ,这 种 串 行 性 使 得 整个 过 程 链 的 
容错 性 能 等 于 其 中 最 差 的 结 点 的 容错 性 能 ,是 典型 的 “灾难 共享 ”, 所 以 要 在 MA 移动 和 
执行 过 程 的 各 个 环节 上 进行 故障 的 预测 .防范 和 故障 后 的 恢复 。 容 错 的 基本 原理 是 采用 
宛 余 技术 ,而 具体 的 宛 余 方 法 有 很 多 种 。 目 前 在 移动 Agent 系统 中 ,总 体 上 来 说 可 以 采 
用 以 下 几 种 宛 余 策略 。 

(1) 任务 求解 的 宛 余 : 创建 多 个 MA 分 别 求解 相同 的 任务 ,最 后 根据 所 有 或 部 分 的 
求解 结果 ,并 结合 任务 的 性 质 决 定 任务 的 最 终结 果 。 该 方法 的 难点 在 于 最 后 结果 的 冲突 
消解 和 综合 。 对 于 任务 求解 结果 比较 明确 .唯一 的 情形 (典型 的 ,如 计算 作业 ) ,可 以 采用 
多 数 优先 的 原则 选择 求解 结果 ,其 依据 是 概率 论 。 对 于 求解 结果 多 样 化 的 任务 (典型 的 ， 
如 Internet 上 的 信息 搜索 ) ,首先 对 结论 有 冲突 的 结果 进行 取舍 ,然后 将 剩余 结果 的 并 集 
作为 最 后 的 结果 ,可 以 将 并 集中 的 结果 根据 出 现 的 概率 进行 排序 。 这 种 方法 在 保证 MA 
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结果 的 有 效 性 方面 具有 很 大 的 优势 ,但 会 耗 用 大 量 的 网 络 资源 和 计算 资源 。 

(2) 集中 式 宛 余 : 将 某 个 主机 作为 元 余 服务 器 ,保存 MA 原始 备份 并 跟踪 MA 的 任 
务求 解 过 程 。 若 MA 失效 , 则 通过 重 发 原始 备份 提供 故障 恢复 。 这 种 方法 的 缺点 是 中 间 
结果 难以 利用 ,可 以 采用 检查 点 技术 对 其 进行 改进 。 方 法 是 : 每 隔 一 个 适当 的 时 间 间 隔 
对 该 MA 做 一 次 检查 点 操作 ,不 断 地 把 程序 运行 的 中 间 状 态 保存 在 检查 点 文件 中 。 在 
MA 出 现 故 障 后 ,利用 该 MA 的 检查 点 文件 把 MA 恢复 到 最 近 一 个 检查 点 时 刻 的 状态 继 
续 运 行 。 这 样 , 利 用 检查 点 采用 这 种 步步为营 的 策略 可 以 保证 长 时 间 运 行 的 MA 最 终 能 
被 正确 地 执行 完毕 。 在 采用 检查 点 技术 的 集中 式 宛 余 方法 中 ,检查 点 文件 被 集中 存放 在 
某 个 固定 的 主机 中 。 集 中 式 完 余 方法 的 缺点 是 存在 集中 环节 ,使 得 该 容错 方法 本 身 缺 乏 
容错 性 。 

(3) 分 布 式 宛 余 : 将 MA 容错 的 责任 分 布 到 网 络 中 多 个 非 固定 的 结 点 中 ,这 些 结 点 
由 宛 余 分 配 策略 决定 。 在 此 也 可 以 采用 检查 点 技术 ,只 是 检查 点 文件 的 获取 和 存放 位 置 
是 分 布 式 的 。 这 种 方法 能 提供 较 理 想 的 容错 机 制 。 

当前 只 有 少数 系统 具有 容错 机 制 。Ara 提供 检查 点 (check_point) 机 制 , 在 Agent 执 
行 中 产生 一 系列 检查 点 , 它 是 Agent 内 部 状态 的 一 个 完整 记录 , 当 Agent 由 于 某 种 原因 
出 错时 ,用 最 近 的 检查 点 把 Agent 恢复 到 出 错 前 的 状态 。Concordia 提供 一 个 持久 存储 
管理 器 (persistent store manager) ,用 于 备份 服务 环境 和 Agent 的 状态 ,其 中 消息 排队 子 
系统 备份 将 要 移动 的 Agent, 直 到 Agent 被 目的 主机 正确 接受 。Tacoma 则 利用 后 台 监 视 
Agent 完成 Agent 出 错 后 的 重新 启动 。 

6. 管理 

MA 在 具有 高 度 自主 特性 的 同时 ,还 应 受到 一 定 程度 的 管理 。 这 种 管理 主要 来 自 源 
主机 ,也 可 能 来 自 目标 主机 ,这 要 依 具体 的 实现 而 定 。 首 先 , 源 主机 要 对 MA 的 行为 负 
责 , 使 其 对 整个 系统 不 会 产生 危害 ;其 次 , 源 主机 还 要 随时 了 解 MA 的 当前 工作 情况 ,以 
避免 MA 的 迷航 或 过 度 复制 ,也 要 随时 回答 MA 提出 的 问题 或 协调 MA 的 工作 。 目 标 主 
机 也 要 将 MA 作为 外 来 Agent 进行 管理 ,避免 其 过 度 使 用 本 地 资源 ,或 协助 其 进行 下 一 
次 的 移动 ,协调 其 与 本 地 Agent 的 交互 等 。 

7. 移动 Agent 的 理论 模型 

移动 Agent 的 理论 模型 刻画 了 位 置 ,移动 ,通信 安全、 容错 资源 控 制 和 资源 配置 等 
基本 概念 ,有 助 于 从 形式 抽象 的 角度 认识 移动 Agent 的 本 质 特征 。 现 有 的 几 种 理论 模型 
是 对 传统 并 发 和 分 布 式 计 算 形 式 与 方法 的 扩充 与 修改 ,有 基于 代数 语义 的 进程 代数 ,如 
CSP ,r- 演 算 等 ,有 基于 指称 语义 的 ACTOR 模型 ,有 基于 状态 转换 语义 的 时 序 逻 辑 , 如 
Unity、TLA 等 。 

8. 移动 Agent 的 协作 模型 

移动 Agent 在 执行 任务 的 过 程 中 经 常 要 和 其 他 实体 进行 协作 (coordination) ,最 常见 
的 协作 对 象 是 MAE 中 的 服务 Agent 及 其 他 移动 Agent。Agent 之 间 的 协作 技术 已 被 广 
泛 、 深 入 地 研究 ,各 国 的 研究 者 提出 了 许多 关于 协作 的 理论 ,模型 和 语言 ,这 些 理论 和 模型 
已 被 广泛 应 用 到 包括 移动 Agent 系统 在 内 的 许多 应 用 系统 中 。 

Cabri 按照 空间 耦合 (spatially coupled) 和 时 态 厅 合 (temporally coupled) 的 标准 把 当 
前 移动 Agent 的 协作 模型 分 为 4 类 : 直接 协作 模型 (direct)、 基 于 黑板 的 协作 模型 
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(blackboard-based) 面向 会 见 的 协作 模型 (meeting-oriented) 和 类 Linda 模型 (Linda- 
like) 。 表 6-2 给 出 了 它们 的 分 类 。 


表 6-2 移动 Agent 协作 模型 分 类 














ee Ss 未 合 非 糯 合 
类 全 direct blackboard-based 
加 Aglets`\D?Agent Ambit ffMain 
非 焕 合 meeting-Oriented Linda-like 
本 Ara、Mole PageSpace TuCSoN .MARS Jada 


空间 耦合 是 指 参与 协作 的 Agent 共享 名 字 空 间 ; 时 态 耦 合 是 指 参与 协作 的 Agent 采 
用 同步 机 制 ,要 求 参 与 协作 的 Agent 在 协作 时 必须 同时 存在 。 

(1) 直接 协作 模型 : 在 此 模型 中 ,参与 协作 的 Agent 向 其 他 Agent 直接 发 送 消息 。 
大 多 数 基于 Java 的 移动 Agent 系统 采用 直接 协作 模式 ,如 Aglets,D’”Agent。 一 些 中 间 
件 (如 CORBA、DCOM) 也 支持 直接 协作 模式 ,它们 封装 了 Agent 的 命名 和 定位 ,使 开发 
人 员 可 以 直接 向 服务 对 象 发 送 消息 ,而 不 必 关 心 消息 是 如 何 到 达 的 。 

(2) 基于 黑板 的 协作 模型 : 该 模型 使 用 一 个 被 称 为 “黑板 (blackboard)” 的 消息 储存 
库 (repository) 存 放 消 息 。 消 息 的 发 送 者 可 以 向 “黑板 " 写 入 消息 ,接收 者 在 需要 的 时 候 从 
“黑板 ” 读 取消 息 。 由 于 “ 写 入 "操作 和 "“ 读 取 ” 操 作 不 需要 同步 执行 ,因此 该 模型 是 非 时 间 
耦合 的 。 发 送 者 在 向 “黑板 ” 写 和 人 消息 的 时 候 , 必 须 给 该 消息 加 上 一 个 唯一 的 标识 ,接收 者 
通过 该 标识 从 “黑板 ”检索 相应 的 消息 。 由 于 协作 双方 事先 需要 知道 消息 的 标识 ,因此 该 
模型 是 空间 耦合 的 。 

Ambit 中 的 每 一 个 结 点 都 维护 一 个 局 部 “黑板 ”, 构 成 一 个 分 布 式 黑板 模型 。Agent 
可 以 向 局 部 “黑板 ”" 写 入 信息 或 从 中 读 取 信息 。ffMain 中 ,用 “信息 空间 (information 
space) ”存放 数 据 信息 ,Agent 通过 HTTP 向 其 写 和 数据 或 从 其 读 取 数 据 。 

(3) 面向 会 见 的 协作 模型 : 在 此 模型 中 参与 协作 的 Agent 聚集 在 同一 个 会 见地 点 
(meeting place) 进 行 通信 、 交 互 。 由 于 在 协作 的 过 程 中 参与 者 不 必 知道 其 他 参与 者 的 名 
字 , 因 此 该 模型 是 非 空间 耦合 的 ,这 使 协作 具有 很 大 的 灵活 性 。 该 模型 要 求 参与 协作 的 
Agent 都 必须 到 达 指 定 的 会 见地 点 进行 同步 交互 ,因此 该 模型 是 时 间 耦 合 的 。 

Ara 系统 实现 了 面向 会 见 的 协作 模型 。 管 理会 见 的 服务 Agent 负责 建立 一 个 会 见地 
点 ,外 来 的 移动 Agent 可 以 进入 该 会 见地 点 同 其 中 的 Agent 进行 协作 。Mole 采用 了 
OMG 提出 的 基于 事件 (event) 的 同步 模型 ,该 模型 可 以 视 为 是 一 个 复杂 的 面向 会 见 模型 。 
事件 是 用 于 同步 的 特殊 对 象 , 同 步 的 双方 都 需要 具有 该 事件 对 象 的 引用 ,这 相当 于 进入 同 
一 个 会 见地 点 。 

(4) 类 Linda 模型 : 该 模型 在 时 间 和 空间 上 都 是 非 耦 合 的 ,是 最 灵活 的 一 种 协作 模 
型 。 类 似 “ 黑 板 ” 协 作 模 型 ,类 Linda 模型 中 也 有 一 些 存 放 消 息 的 空间 ,这 些 空间 被 称 为 元 
组 (tuples) 空 间 ,tuples 中 的 消息 都 以 元 组 表示 。 与 “黑板 ”协作 模型 不 同 的 是 ,类 Linda 
模型 不 是 通过 “标识 ”进行 消息 检索 ,而 是 采用 所 谓 的 “联想 式 (Associative Way) ”检索 。 
这 种 方式 使 用 “模式 匹配 (pattern matching) ”机制 , 只 用 部 分 信息 就 可 以 检索 出 完整 的 消 
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息 。 通 过 这 种 方式 ,参与 协作 的 Agent 不 需要 共享 任何 信息 。 

基于 Java 的 移动 Agent 系统 Jada 提出 了 “联想 黑板 (associative blackboard) ”概念 ， 
维护 多 个 对 象 空间 (object space) 。 移 动 Agent 使 用 对 象 空间 存放 对 象 ,并 用 对 象 空间 以 
联想 方式 检索 对 象 的 引用 。 系 统 也 允许 移动 Agent 创建 和 有 的 对 象 空间 进行 私有 的 交 
互 。MARS 对 元 组 空间 增加 了 可 移植 性 (portable) 和 反应 性 (reactive)。 元 组 空间 的 接 
口 严格 遵循 JavaSpace 规范 ,反应 (reactions) 是 一 些 与 元 组 有 关 的 Java 方法 (Java 
Method) , 当 元 组 被 匹配 后 ,相关 的 反应 被 执行 。 


6.6.4 移动 Agent 系统 


自 1994 年 第 一 个 商业 化 的 移动 Agent 系统 Telescript 问世 以 来 ,移动 Agent 技术 就 
受到 学 术 界 、 工 业界 的 广泛 关注 。 移 动 Agent 的 研究 主要 分 为 两 个 方面 : 移动 Agent 系 
统 及 其 实现 技术 的 研究 ;移动 Agent 技术 应 用 的 研究 。 前 者 主要 研究 移动 Agent 系统 的 
体系 结构 、 移 动 Agent 的 模型 、 移 动机 制 、 移 动 策略 .通信 机 制 、 程 序 设计 语言 .管理 控制 
机 制 、 安 全 技术 、 容 错 技术 、 建 模 技术 和 理论 .协作 技术 等 方面 ;后 者 着 重 研究 面向 应 用 领 
域 的 移动 Agent 技术 及 应 用 ,迄今 为 止 在 电子 商务 、 网 络 管理 ,智能 搜索 引擎 ,移动 计算 、 
工作 流 管理 ,并 行 处 理 、 信 息 (软件 ) 分 发 和 个 人 助理 等 领域 都 开展 了 移动 Agent 应 用 研 
究 。 另 外 还 包括 移动 Agent 和 其 他 研究 领域 的 交叉 研究 , 如 与 分 布 式 对 象 技术 
(CORBA) 的 结合 ,与 智能 Agent 的 结合 。 

实现 移动 Agent 系统 的 关键 技术 在 前 面 已 做 了 介绍 ,这 里 只 对 移动 Agent 系统 的 研 
究 、 开 发 情况 进行 综述 。 具 有 代表 性 的 MA 系统 在 表 6-3 中 列 出 。 

表 6-3 移动 Agent 系统 列表 








序号 | 系统 名 称 实现 语言 系统 描述 
1 T g i 第 一 个 商业 化 的 MA 系统 ,后 继 版 本 基于 Java, 改 名 
elescript Telescript 
为 Odyssey 
2 A as 该 系统 中 的 移动 Agent 称 为 Messenger, 可 以 自主 地 
让 E 创建 记 辑 网 络 并 在 该 网 络 中 移动 





功能 最 全 的 移动 Agent 系统 ,后 继 版 本 支持 包括 Java 
在 内 的 多 种 语言 ,改名 为 D’ Agent 


支持 语言 种 类 和 操作 系统 平台 最 多 的 MA 系统 。 可 


3 Agent Tcl Tcl/Tk, Scheme, Java 





C,Tcl/Tk, Scheme 














4 Tacoma 以 使 用 Web 浏览 器 和 电子 邮件 发 送 Agent 并 接收 执 
Perl,Python, VB ee 
行 结果 
5 Ara C/C++ ,Tcl,Java 致力 于 用 当前 现 有 的 编程 语言 实现 移动 Agent 
6 Mole Java 第 一 个 基于 Java 的 移动 Agent 系统 
. Kalet ji 最 早 的 基于 Java 的 商业 化 移动 Agent 系统 , 是 
JavaApplet 模型 的 扩充 

功能 完备 的 移动 Agent 系统 ,首次 提出 旅行 计划 的 概 

8 Concordia Java 


念 ,已 应 用 于 移动 计算 、 分 布 式 数据 库 等 领域 


基于 Agent 的 分 布 式 对 象 技 术 , 既 支持 移动 ,又 支持 
传统 的 分 布 式 计算 





9 Voyager Java 
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续 表 
序号 | 系统 名 称 实现 语言 系统 描述 
wo Bie Oblie dd he 0 对 象 
11 | Jumping bean | Java 可 以 开发 具有 移动 能 力 的 Java 应 用 程序 
12 | Grasshopper |Java 第 一 个 遵循 MASIF 标准 的 移动 Agent 系统 
13 | OAA C,C-Lisp,Java,VB ”| 开放 的 Agent 体系 结构 
14 | MOA Java 基于 Agent 的 移动 对 象 系统 
15 | Kali Scheme “| Scheme 目前 已 应 用 于 分 布 式 数据 挖掘 、 负 载 平衡 等 领域 
16 | Tube Scheme 一 种 Agent 协调 机 制 
17 | AgentSpace “| Java 基于 Java 的 移动 Agent 系统 
18 | Plangent Java 基于 Agent 的 智能 规划 系统 
19 | JATlite Java 支持 KQML 信息 查询 
20 | Kafka Java 支持 多 Agent 技术 
21 | Gossip Java 二 Internet 上 进行 信息 交换 的 移动 Agent 应 用 
22 | Gypsy Java 面向 Internet 信息 查询 .电子 商务 .移动 计算 和 网 络 管 
理 领 域 研究 的 实验 系统 
23 | Knowbot Python etd 月 请 只是 一 全 过 王 条 
人 区 本 je 包含 一 个 经 过 修改 的 JVM 称 为 Aroma, 支 持 Java 线 
程 状态 的 捕捉 ,支持 强 移动 











目前 的 MA 系统 可 从 其 实现 语言 上 大 致 分 为 如 下 两 类 : 基于 Java 语言 的 MA 系统 
和 基于 非 Java 语言 的 MA 系统 (也 可 以 分 为 多 语言 系统 和 单 语 言 系统 )。 

基于 非 Java 语言 的 MA 系统 的 典型 代表 除了 Telescript 外 ,还 有 Dartmouth 学 院 研 
制 的 D” Agent, 挪威 的 Tromso 大 学 和 美国 Cornell 大 学 联合 研制 的 Tacoma, 德国 
Kaiserslautern 大 学 研制 的 Ara,DECCCompaq) 研 究 院 研 制 的 Obliq 等 。 

基于 非 Java 语言 的 MA 系统 常常 基于 专 有 的 软 硬 件 系统 ,通用 性 受到 较 大 的 限制 。 
跨 平台 语言 Java 的 出 现 , 使 得 MA 技术 的 研究 有 了 较 大 的 进展 ,并 且 已 经 研制 出 了 很 多 
实验 性 系统 和 商品 化 软件 。 例 如 ,德国 Stuttgart 大 学 开发 了 第 一 个 基于 Java 的 移动 
Agent 系统 Mole,IBM 公司 的 Aglets 是 第 一 个 基于 Java 的 商品 化 移动 Agent 系统 ,也 是 
目前 最 流行 的 移动 Agent 系统 ,ObjectSpace 研制 了 Voyager, 美 国 加 州 大 学 Berkeley 分 
校 研 制 了 Java-to-go 等 。General Magic 公司 也 在 Telescript 概念 的 基础 上 开发 了 一 个 基 
于 Java 的 移动 Agent 系统 一 一 Odyssey。 


6.6.5 移动 Agent 技术 的 应 用 场景 


移动 Agent 作为 关键 技术 被 广泛 应 用 在 电子 商务 (特别 是 移动 电子 商务 )、 分 布 式 信 
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息 查 询 ( 智 能 搜索 引擎 ) 网 络 管理 ,移动 计算 .工作 流 管理 .并 行 处 理 、 信 息 (软件 ) 分 发 .个 
人 助理 ,监控 与 通告 等 领域 。 

1. 电子 商务 

移动 Agent 的 移动 性 和 自主 性 为 网 络 环境 (尤其 是 Internet 环境 下 的 电子 商务 应 用 ) 
提供 了 很 多 潜在 的 优点 ,给 电子 商务 带 来 了 新 的 机 遇 , 被 誉 为 是 电子 商务 的 “催化 剂 ”, 基 
于 Agent 的 电子 商务 (Agent-Based E-Commerce, ABEC) 成 为 一 个 新 的 研究 领域 。 在 
ABEC 中 ,Agent 代表 其 所 有 者 的 利益 参与 商务 活动 。 代 表 消 费 者 的 Agent 可 以 自主 地 
移动 到 多 个 电子 市 场 ,寻找 所 需 的 商品 ,查询 商品 的 价格 , 同 供应 商 进行 价格 协商 。 代 表 
生产 商 的 移动 Agent 可 以 向 电子 市 场 发 布 产品 信息 ,也 可 以 主动 上 门 向 顾客 提供 服务 。 
代表 市 场 管理 部 门 的 Agent 负责 整个 市 场 的 管理 工作 。 多 个 Agent 之 间 的 协作 可 以 采 
用 移动 Agent 的 协作 模型 ,管理 技术 安全 技术 和 容错 技术 可 以 保证 Agent 进行 有 序 的 、 
安全 的 、 可 靠 的 商务 活动 。 

2. 分 布 式 信息 查询 

目前 面向 Internet 信息 检索 的 所 有 搜索 引擎 采用 的 技术 都 是 在 线 查询 ,并 且 搜 索 的 
覆盖 面 有 限 ,提供 的 查询 方式 有 限 ,查询 精度 低 , 返 回 的 大 量 结果 中 往往 只 包含 少数 信息 
或 不 包含 用 户 关心 的 信息 。 移 动 Agent 技术 支持 离线 查询 ,一 个 或 多 个 移动 Agent 携带 
着 查询 要 求 自主 地 移动 到 各 个 相关 的 信息 源 上 ,相互 协作 ,搜索 与 用 户 最 相关 的 信息 , 当 
用 户 重新 连 线 时 ,返回 综合 的 查询 结果 。 动 态 派生 子 Agent 的 能 力 可 以 大 大 提高 搜索 的 
并 行 度 和 搜索 范围 ,提供 个 性 化 服务 的 能 力 可 以 向 用 户 提供 多 种 查询 方式 。Dartmouth 
学 院 Brian Brewington 等 人 使 用 D’ Agent 建立 了 一 个 分 布 式 信息 查询 的 应 用 。 

3. 网 络 管理 

大 型 网 络 (如 电信 网络 、 交 通 网 络 、 计 算 机 网 络 等 ) 都 需要 容错 管理 (故障 诊断 与 恢 
复 ) 、 计 费 管 理 、 配 置 管理 性 能 管理 ,安全 管理 等 基本 管理 。 客 户 /服务 器 模式 是 当今 网 络 
管理 的 基本 模式 ,其 固有 缺点 随 着 网 络 日 趋 复 杂 、 规 模 不 断 扩 大 、 应 用 服务 数量 剧 增 而 越 
来 越 明显 ,管理 工作 站 数据 处 理 和 网 络 带宽 成 为 其 瓶颈 ,不 具有 动态 变化 的 伸缩 性 。 使 用 
移动 Agent 技术 可 以 对 整个 网 络 建 模 ,利用 其 移动 性 、 自 主 性 和 反应 性 可 以 建立 一 个 灵 
活 ,统一 ,健壮 的 网 络 管理 体系 。 

4. 移动 计算 

移动 计算 的 3 个 基本 特征 是 : 无 线 通信 ,移动 性 和 便携 性 。 无 线 通信 指 移动 设备 之 
间 的 通信 通过 低速 ,高 延迟 .不 可 靠 的 无 线 网 络 ; 移 动 性 指 通信 设备 的 地 理 位置 经 常 发 生 
变化 ,导致 和 位 置 有 关 的 系统 配置 信息 需要 经 常 改变 ;便携 性 指 移动 设备 尽 可 能 小 巧 , 便 
于 携带 ,这 限制 了 设备 的 计算 能 力 和 存储 能 力 。 使 用 移动 Agent 技术 可 以 全 面 解决 以 上 
3 个 问题 ,移动 Agent 支持 离线 计算 ,可 以 有 效 地 节省 网 络 带宽 ,非常 适合 无 线 通信 和 网络 ; 
移动 Agent 的 平台 无 关 性 可 以 避免 移动 设备 的 配置 随 位 置 的 变化 而 不 断 更 改 ; 移 动 设备 
可 以 将 定制 的 移动 Agent 发 送 到 服务 器 上 执行 ,充分 利用 服务 器 的 计算 资源 ,从 而 克服 
了 移动 设备 计算 能 力 弱 的 缺点 。 

5. 工作 流 管理 

传统 的 工作 流 管理 系统 无 论 是 采用 集中 式 管 理 方法 ,还 是 采用 分 散 式 管理 方法 ,大 都 
是 基于 客户 /服务 器 模型 。 但 是 :基于 客户 /服务 器 模型 的 传统 工作 流 管理 系统 灵活 性 较 
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差 ,很 难 适应 日 趋 复杂 的 企业 计算 环境 。 车 把 工作 流 项 的 信息 和 行为 封装 在 一 个 移动 
Agent 中 ,利用 移动 Agent 的 移动 性 和 自主 性 在 工作 流 模型 中 移动 执行 , 则 会 极 大 地 提高 
工作 流 管理 系统 的 灵活 性 ,从 而 克服 传统 工作 流 管理 系统 的 不 足 。 

6. 并 行 处 理 

移动 Agent 可 以 派生 多 个 子 Agent, 这 些 子 Agent 可 以 发 送 到 网 上 异步 .并 行 .自主 
地 执行 。 人 为 地 或 自动 地 将 一 个 大 规模 的 问题 分 解 成 多 个 子 任务 ,分 别 交 给 不 同 的 移动 
Agent 去 执行 ,这 些 Agent 自主 地 移动 到 网 络 中 的 各 个 结 点 ,充分 利用 网 络 中 空闲 的 计算 
资源 和 可 用 的 信息 资源 ,相互 协作 ,共同 求解 。 移 动 Agent 这 种 动态 派生 的 能 力 可 以 有 
效 地 提高 任务 执行 的 并 行 度 。 

7. 信息 (软件 ) 分 发 

利用 移动 Agent 技术 可 以 实现 * 推 (PUSH)? 模 型 ,移动 Agent 携带 要 发 布 的 信息 或 
要 安装 的 软件 移动 到 有 订购 需求 的 客户 机 器 ,自动 执行 信息 发 布 或 软件 安装 操作 。 在 软 
件 安装 的 执行 过 程 中 ,移动 Agent 自动 搜集 相关 信息 ,如 运行 环境 信息 .用 户 信息 、 系 统 
配置 信息 等 ,自动 地 创建 安装 目录 、 解 压缩 软件 包 ,配置 参数 ,直至 软件 被 正确 安装 。 软 件 
的 维护 与 升级 工作 也 可 以 借助 移动 Agent 完成 。 

8. 个 人 助理 

移动 Agent 具有 智能 性 和 移动 性 ,因此 可 以 代表 用 户 处 理 远 程 事 务 。 例 如 ,在 会 议 召 开 
前 ,代表 各 个 与 会 者 的 移动 Agent 可 以 交互 协商 出 一 个 与 会 者 都 可 以 接受 的 会 议 日 程 安排 。 

9. 监控 与 通告 

移动 Agent 可 以 移动 到 某 一 个 信息 源 ,进行 实时 监控 , 当 其 等 待 的 事件 发 生 或 所 需 
的 信息 可 用 时 ,向 用 户 发 出 通知 。 例 如 ,可 以 派送 多 个 Agent 分 别 监视 不 同 股票 的 交易 
情况 。 监 控 Agent 的 生命 周期 可 以 长 于 创建 它们 的 进程 。 

另外 ,移动 Agent 还 可 用 于 主动 网 络 (active network) 、 安 全 代理 (secure brokering)、 
群 件 技术 (groupware) 等 领域 。 


6.7 多 Agent 系统 开发 框架 JADE 


JADE 是 Java Agent DEvelopment Framework 的 缩写 , 它 完全 用 Java 实现 ,支持 采 
用 Java 开发 可 互 操作 的 多 Agent 系统 。 它 提供 了 遵循 FIPA 技术 规范 的 可 重用 软件 开 
发 包 ,封装 并 实现 了 多 Agent 系统 的 诸多 基本 功能 ,从 而 简化 了 多 Agent 系统 的 开发 和 
运行 。JADE 所 遵循 的 FIPA 规范 包括 Agent 管理 规范 (Agent Management 
Specification)、Agent 通信 语言 规范 (Agent Communication Language Specification) 和 
Agent 通信 语言 消息 规范 (ACL Message Specification)。 

JADE 采用 中 间 件 的 形式 提供 了 以 下 3 个 组 成 部 分 支持 多 Agent 系统 的 开发 .部 署 、 
运行 和 管理 。 

(1) 软件 开发 包 。JADE 提供 了 一 组 可 重用 软件 开发 包 , 它 们 封装 了 Agent 以 及 
Agent 间 通 信 及 其 协议 等 方面 的 基本 功能 .软件 开发 人 员 可 以 通过 重用 这 些 软件 包 开 展 
多 Agent 系统 的 开发 。 

(2) 运行 环境 。JADE 提供 了 一 个 运行 环境 部 署 所 开发 的 各 个 Agent, 并 支持 这 些 
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Agent 的 运行 和 管理 。 

(3) 图 形 化 工具 集 。JADE 提供 了 一 组 图 形 化 的 软件 工具 集 支持 多 Agent 系统 的 调 
试 . 部 署 、 管 理 和 维护 。 

JADE 包含 有 一 个 基于 Java 虚拟 机 的 分 布 式 环境 支持 多 Agent 系统 的 部 署 和 运行 ， 
如 图 6-17 所 示 。 





























Java 运 行 环境 Java 运 行 环 境 
昌 昌 


图 6-17 JADE 提供 的 分 布 式 Agent 部 署 和 运行 环境 




















由 JADE 开 发 的 多 个 Agent 可 以 部 署 在 一 个 由 多 台 计 算 机 组 成 的 分 布 式 环境 中 执行 。 
每 一 个 主机 上 都 部 署 一 个 Agent 容器 。 每 个 Agent 容器 均 运 行 在 Java 虚拟 机 之 上 并 为 部 
署 在 该 容器 的 Agent 提供 运行 支持 。 它 实际 上 是 JADE 框架 在 计算 结 点 上 的 一 个 运行 实 
例 。 基 于 JADE 开发 的 Agent 必须 运行 在 特定 的 容器 之 上 ,因而 容器 成 为 Agent 运行 的 载 
体 。 每 个 Agent 只 能 部 署 在 一 个 容器 上 运行 ,一 个 容器 可 包含 多 个 Agent。 不 同 容 器 之 间 
的 Agent 通过 JADE 提供 的 基础 设施 实现 相互 之 间 的 交互 和 通信 。 

在 JADE 平 台 的 诸多 Agent 容器 中 ,必须 有 一 个 主 容器 。JADE 的 主 容 器 负责 管理 
JADE 平台 中 的 其 他 容器 以 及 这 些 容 器 中 的 Agent, 因 此 它 必须 在 系统 运行 时 始终 处 于 
活跃 状态 。 一 个 主 容 器 及 其 所 管理 的 其 他 Agent 容器 构成 了 JADE 平台 。JADE 的 主 容 
器 有 两 个 特殊 的 Agent: Agent 管理 系统 (Agent Management System, AMS) 和 目录 协调 
(Directory Facilitator,DF)Agent。 它 们 负责 对 系统 中 的 Agent 分 别提 供 白 页 和 黄页 服 
务 , 如 图 6-18 所 示 。 

。 Agent 管理 系统 

Agent 管理 系统 负责 管理 系统 中 Agent 的 基本 信息 ,如 Agent 的 唯一 命名 、 所 在 的 
容器 和 地 址 .端口 号 等 ,维护 系统 中 Agent 的 信息 列表 ,因而 为 多 Agent 系统 提供 命名 白 
页 服务 。 根 据 FIPA 技术 规范 ,每 个 Agent 都 有 一 个 唯一 的 命名 。AMS 记录 了 每 个 
Agent 的 地 址 和 状态 信息 (如 是 否 处 于 活跃 状态 .是 否 正 在 迁移 中 ) ,可 以 对 系统 中 的 
Agent 及 其 对 平台 的 访问 和 使 用 进行 管理 ,如 创建 一 个 Agent、 杀 死 一 个 Agent。 每 个 
Agent 运行 时 需要 在 Agent 管理 系统 进行 注册 ,并 提供 其 基本 的 白 页 信息 。 

。 目录 协调 Agent 

目录 协调 Agent 负责 管理 系统 中 各 个 Agent 对 外 提供 的 服务 ,如 服务 的 名 称 、 提 供 
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Agent 通信 通道 (Agent Communication Channel) 


缓存 
容器 内 部 的 消息 传输 容器 之 间 的 消息 传输 平台 之 间 的 消息 传输 
(基于 Java 事件 ) (基于 JavaRMI ) (基于 IIOP) 


图 6-18 JADE 的 Agent 管理 系统 和 目录 协调 Agent 
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服务 的 Agent 标识 等 ,维护 系统 中 的 服务 列表 ,因而 为 多 Agent 系统 提供 黄页 服务 。 当 
一 个 Agent 创建 时 , 它 需 要 向 目录 协调 Agent 注册 其 可 对 外 提供 的 服务 。 其 他 Agent 可 
通过 查询 目录 协调 者 为 系统 中 的 服务 提供 信息 。 

JADE 由 Telecom Italia 开发 , 它 是 一 个 开源 软件 ,读者 可 以 访问 网 站 http://JADE. 
tilab. com/ 获得 该 软件 。 


6.7.1 程序 模型 
在 JADE 平 台中 ,Agent 是 一 个 封装 有 多 个 任务 并 且 这 些 任务 可 并 发 执行 的 行为 实 


体 (图 6-19) ,Agent 的 任务 由 行为 (behavior) 加 以 定义 。 因 此 ,JADEAgent 的 内 部 包含 以 
下 一 组 基本 构件 。 


图 6-19 JADE 中 Agent 的 软件 体系 结构 





(1) 行为 。 在 JADE 框架 中 ,一 个 Agent 的 任务 对 应 于 Agent 可 实施 的 行为 。JADE 
采用 行为 模型 支持 Agent 的 构造 和 和 运行。 一 个 行为 对 应 于 一 组 动作 和 语句 序列 。 多 个 
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行为 可 经 过 组 合 形成 复合 行为 ,并 采用 顺序 或 者 并 发 的 方式 加 以 执行 。 因 此 ,一 个 Agent 
内 部 包含 了 一 个 或 者 多 个 行为 。 

(2) 行为 调度 器 。 每 个 Agent 的 内 部 都 有 行为 调度 器 负责 行为 的 加 载 、 管 理 和 执行 。 
Agent 将 其 欲 执行 的 行为 放 在 调度 器 的 行为 池 中 ,调度 器 每 次 从 行为 池 中 取出 一 个 行为 
执行 。JADE 的 调度 器 采用 非 抢 先 的 方式 来 调度 行为 , 即 一 个 行为 被 调度 执行 之 后 ,该 行 
为 将 一 直 处 于 执行 状态 ,直到 该 行为 执行 完成 。 

(3) ACL 消息 接收 池 。JADEAgent 之 间 基 于 ACL 消息 进行 异步 消息 通信 。 每 个 
Agent 内 部 都 有 一 个 ACL 消息 池 ,类 似 于 邮箱 ,负责 管理 接收 到 的 消息 。 一 旦 Agent 接 
收 到 某 个 消息 ,那么 该 消息 将 被 置 于 其 邮箱 中 ,并 同时 通知 该 Agent。 

(4) 生命 周期 管理 器 。JADE 中 的 Agent 被 创建 后 , 它 将 具有 其 生命 周期 状态 并 且 
在 其 整个 生命 周期 中 Agent 可 能 处 于 不 同 的 状态 。Agent 内 部 有 其 生命 周期 管理 器 负责 
对 Agent 的 状态 进行 管理 。 


6.7.2 可 重用 开发 包 


为 了 支持 和 简化 多 Agent 系统 的 开发 ,JADE 提供 了 以 下 一 组 可 重用 的 软件 开发 包 。 
程序 员 可 以 通过 重用 这 些 软件 包 编 写 多 Agent 系统 的 程序 代码 。 

。 JADE. core, 实现 了 系统 的 核心 功能 ,包括 Agent 类 ,以 实现 Agent, 其 子 包 
“JADE. core. behaviours” 中 的 多 种 Behavior 类 用 以 定义 Agent 的 行为 。 
JADE. lang. acl, 实 现 了 Agent 通信 语言 的 处 理 功 能 。 
JADE. content ,实现 了 一 组 功能 以 支持 用 户 自 定义 本 体 和 内 容 描述 语言 ,尤其 是 
子 包 “JADE. content. lang. sl" 实 现 了 SL 内 容 描 述 语 言 的 分 析 器 和 编码 器 。 
JADE. domain, 实 现 了 FIPA 标准 所 定义 的 一 组 管理 Agent, 包 括 AMS 和 DF 等 。 
JADE. gui, 实 现 了 一 组 通用 的 图 形 化 界面 类 ,用 来 显示 和 编辑 Agent 标识 、Agent 
描述 和 ACL 消息 。 
JADE. mtp, 提 供 了 消息 传输 协议 人 须 实现 的 一 组 Java 接口 。 
JADE. proto, 提 供 了 一 组 预定 义 的 标准 交互 协议 ,该 包 也 支持 程序 员 自 定义 的 交 
互 协 议 。 
JADE. wrapper ,提供 了 JADE 高 级 功能 的 包装 器 (wrappers) ,使 得 外 部 的 Java 程 
序 可 以 加 载 JADEAgent 和 容器 。 

一 般 地 ,基于 JADE 的 多 Agent 系统 开发 需要 涉及 以 下 几 个 方面 的 内 容 。 

1. 编写 Agent 类 

由 JADE 编写 的 软件 须 实现 一 组 Agent, 每 个 Agent 的 程序 代码 须 继承 JADE 开发 
包 中 的 Agent 类 。 例 如 ,下 面 的 程序 代码 定义 了 一 个 BookBuyerAgent, 该 Agent 的 主要 
任务 是 要 购买 用 户 所 需 的 书籍 。 该 类 继承 了 JADE 开发 包 中 的 JADE. core. Agent 类 ,其 
中 的 setup() 方 法 将 在 Agent 创建 时 被 调用 ,通常 它 包 含 了 Agent 的 一 些 初 始 化 程序 代 
码 。 在 下 面 的 程序 代码 中 ,setup() 方 法 将 输出 该 Agent 的 名 字 。 
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import jade.core.Agent; 
public class BookBuyerAgent extends Agent { 
protected void setup() 
//Printout a welcome message 
System.out .println(“Hello! Buyer-agent “+getAID() .getName ()+” is ready.”); 
和, } 

JADE 中 的 任何 Agent 都 有 一 个 唯一 的 全 局 命名 , 它 采 用 二 nickname 记 @ 二 platform- 
name 二 的 形式 。 其 中 ,nichname 是 Agent 的 名 字 ,platformname 是 Agent 所 在 平台 的 名 
字 。 例 如 ,Peter-Agent@EC 是 某 个 Agent 的 全 局 命名 ,该 Agent 的 名 字 是 Peter-Agent, 它 处 
于 名 为 EC 的 JADE 平 台中 。JADEAgent 是 一 个 多 任务 的 行为 实体 ,Agent 的 任务 由 其 行为 
加 以 定义 。 软 件 开发 人 员 可 以 通过 继承 JADE. core. behaviours. Behaviour 类 定义 行为 类 , 实 
现 该 类 action() 方 法 以 定义 行为 的 具体 动作 。 程 序 员 可 以 在 Agent 类 中 通过 代码 
addBehaviour() 增 加 Agent 的 行为 ,也 可 以 通过 removeBehaviour() 方 法 将 行为 从 Agent 的 任 
务 队列 中 删除 。 

2. Agent 的 行为 

JADE 软件 开发 包 封装 了 以 下 一 组 预定 义 的 行为 支持 Agent 的 行为 编程 。 

1) 一 般 行 为 

这 类 行为 Behaviour 有 两 个 抽象 方法 action() 和 done() ,程序 员 需 要 实例 化 action() 
方法 ,以 编写 行为 的 具体 动作 以 及 done(), 以 表明 什么 情况 下 该 行为 被 成 功 地 完成 。 
Behaviour 类 有 方法 block(), 它 可 以 阻塞 行为 的 执行 。 程 序 员 可 以 通过 重用 JADE. 
core. behaviours. Behaviour 类 并 采用 以 下 程序 框架 构造 一 般 性 行为 。 

2) 一 次 性 行为 OneShotBehaviour 

OneShotBehaviour 是 一 类 简单 行为 , 它 继承 了 一 般 性 行为 Behaviour。 一 次 性 行为 
的 特点 是 该 行为 的 动作 部 分 只 被 执行 一 次 。 也 就 是 说 , JADE. core. behaviours. 
OneShotBehaviour 已 经 实现 了 OneShotBehaviour 行为 的 done() 方 法 ,使 得 其 返回 值 为 
true。 程 序 员 可 以 通过 重用 OneShotBehaviour 并 实例 化 其 抽象 方法 action() 实 现 一 个 一 
次 性 行为 。 

3) 循环 行为 CyclicBehaviour 

CyclicBehaviour 也 是 一 类 简单 行为 , 它 继承 了 一 般 性 行为 Behaviour。 循环 行为 的 特 
点 是 其 动作 执行 部 分 即 action () 将 被 多 次 执行 。 也 就 是 说 ,JADE. core. behaviours. 
CyclicBehaviour 已 经 实现 了 CyclicBehaviour 行为 的 done() 方 法 ,使 得 其 返回 值 为 false。 

4) WakerBehaviour 和 TickerBehaviour 行为 

JADE 在 其 软件 开发 包 中 预定 义 了 两 个 特殊 行为 WakerBehaviour 和 TickerBehaviour， 
使 得 Agent 可 以 在 特定 的 时 间 点 执行 某 些 行为 。 其 中 , WakerBehaviour 行为 使 得 Agent 在 
规定 的 时 间 后 执行 某 些 操作 ,TickerBehaviour 行为 使 得 Agent 在 每 隔 规定 时 间 重 复 执行 某 
些 操作 。 

5) 顺序 行为 SequentialBehaviour 

该 行为 是 一 类 复合 行为 .表示 多 个 行为 的 顺序 执行 。 程 序 员 可 以 通过 addSubBehviour() 
方法 增加 待 顺序 执行 的 各 个 子 行为 。 
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6) 并 行 行为 ParallelBehaviour 

该 行为 是 一 类 复合 行为 ,表示 多 个 行为 的 并 发 执行 。 程 序 员 可 以 通过 addSubBehviour() 
方法 增加 待 并 发 执行 的 各 个 子 行为 。 

7) 有 穷 状态 自动 机 行为 FSMBehaviour 

该 行为 是 一 类 复合 行为 ,表示 根据 程序 员 定义 的 有 穷 状态 自动 机 执行 其 行为 。 

3. Agent 之 间 的 ACL 消息 传递 

在 JADE 软件 开发 框架 中 ,不 同 Agent 之 间 通 过 ACL 消息 进行 通信 和 交互 。 因 此 ， 
多 Agent 系统 的 编程 通常 需要 对 Agent 之 间 的 消息 传递 进行 处 理 , 包 括 生成 和 发 送 ACL 
消息 、 接 收 和 处 理 ACL 消息 。 

1) 生成 和 发 送 ACL 消息 

程序 员 可 以 通过 创建 ACLMessage 对 象 ,并 利用 该 对 象 所 提供 的 一 组 方法 生成 ACL 
消息 。 一 个 Inform 类 型 消息 的 生成 方法 包括 : (1) 创 建 一 个 ACL 消息 对 象 ; (2) 通 过 访 
问 其 一 组 方法 (如 addReceiver、setLanguage 等 ) 分 别 设置 ACL 消息 的 接收 方 Agent、 内 
容 描述 语言 ,本体 和 消息 内 容 ; (3) 通 过 send() 语 句 发 出 消息 。 

由 于 ACL 消息 体 中 已 经 表明 了 消息 的 接收 者 Agent, 因 此 消息 的 发 送 方 Agent 无 须 
在 send() 方 法 中 提供 接收 方 的 相关 信息 。JADE 平台 的 ACC 负责 对 每 个 ACL 消息 进行 
解析 并 转发 到 目的 方 Agent。 

2) 接收 和 处 理 ACL 消息 

Agent 可 以 通过 receive 语句 从 其 消息 队列 中 接收 ACL 消息 ,并 利用 ACLMessage 
类 提供 的 一 组 方法 (如 getContent、createReply) 对 消息 进行 分 解 和 处 理 。 

4. 与 DF 进行 信息 交换 

通常 情况 下 ,Agent 需要 将 其 对 外 提供 的 服务 在 DFAgent 中 进行 注册 ,从 而 使 得 其 
他 Agent 可 以 获得 该 服务 信息 。 一 个 Agent 也 可 以 通过 与 DFAgent 进行 交互 ,从 而 查 
询 它 所 需 服 务 的 基本 信息 ,如 系统 中 是 否 存在 它 所 需 的 服务 、 哪 个 Agent 可 以 提供 该 服 
务 .服务 的 提供 需要 满足 什么 条 件 等 。 

1) 发 布 一 个 服务 

为 了 发 布 一 个 服务 , Agent 首先 须 创建 一 个 DFAgentDescription 对 象 以 及 
ServiceDescription() 对 象 ,它们 分 别 描述 了 待 发 布 服务 的 Agent 及 其 待 发 布 服务 的 基本 
信息 ,然后 通过 调用 DFService 的 静态 方法 register() ,从 而 在 DF 中 注册 Agent 的 服务 。 

2) 查询 和 获取 服务 信息 

在 Agent 的 运行 过 程 中 , 它 需 要 在 DFAgent 中 查询 所 需 的 服务 并 获得 这 些 服务 的 详 
细 信 息 , 包 括 谁 可 以 提供 该 服务 、 提 供 服务 Agent 的 名 字 和 地 址 是 什么 等 。 


6.7.3 ”开发 和 运行 的 支持 工具 


为 了 支持 多 Agent 系统 的 调试 .部署 .运行 和 管理 .JADE 提供 了 一 组 图 形 化 软件 
工具 。 

(1) 远程 管理 Agent(Remote Management Agent, RMA)。 该 工具 提供 了 一 个 图 形 
化 的 界面 (图 6-20) 支 持平 台 的 管理 和 控制 。 它 还 可 以 启动 其 他 的 JADE 工具 。 





人 工 知 雍 ( 荔 3 版 ) 
(2) DummyAgent。 这 是 一 个 监视 和 调试 工具 (图 6-20) ,程序 员 可 以 通过 该 工具 提 
供 的 图 形 化 界面 生成 ACL 消息 ,并 将 消息 发 送 给 平台 中 的 其 他 Agent。 该 工具 还 可 以 显 
示 系 统 中 所 有 发 送 和 接收 的 ACL 消息 列表 。 
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图 6-20 RMA 和 DummyAgent 的 运行 界面 


(3) DF 图 形 化 界面 软件 。 该 软件 提供 了 一 个 图 形 化 的 界面 ,帮助 DF 以 及 用 户 创建 
和 管理 平台 中 Agent 的 黄页 ,建立 不 同 DF 之 间 的 联盟 。 

(4) Sniffer Agent。 该 Agent 可 以 拦截 发 送 中 的 ACL 消息 ,并 采用 类 似 于 UML 顺 
序 图 的 形式 显示 这 些 ACL 消息 。 程 序 员 可 以 利用 该 工具 调试 一 组 Agent 之 间 的 消息 交 
换 和 对 话 过 程 。 

(5) IntrospectorAgent。 该 Agent 可 以 监视 平台 中 Agent 的 生命 周期 .它们 之 间 交 
换 的 ACL 消息 以 及 执行 的 行为 。 

(6) LogManagerAgent。 该 Agent 帮助 用 户 建立 起 针对 JADE 平台 以 及 Java 程序 
的 运行 时 日 志 信息 。 

(7) SocketProxyAgent。 该 Agent 扮演 了 类 似 于 网 关 的 角色 ,实现 JADE 平台 和 普 
通 TCP/IP 连接 之 间 的 消息 内 容 转换 和 发 送 。 例 如 ,JADE 平台 中 发 送 的 ACL 消息 经 过 
该 Agent 处 理 后 可 以 转换 为 ASCII 表示 的 符号 串 ,并 通过 Socket 连接 进行 发 送 。 


6.8 案例 : 火星 探矿 机 器 人 


本 节 介 绍 多 Agent 系统 应 用 案例 一 一 火星 探矿 机 器 人 ,以 及 系统 中 的 典型 应 用 场 
景 ,分 析 每 个 Agent 的 设计 目的 及 它们 之 间 的 交互 和 协同 。 


6.8.1 需求 分 析 


“火星 探矿 机 器 人 ” 旨 在 要 开发 若干 个 自主 机 器 人 ,将 其 送 到 火星 上 去 搜寻 和 采集 火 
星 上 的 矿产 资源 。 

火星 环境 对 于 开发 者 和 自主 机 器 人 而 言 事先 不 可 知 ,但 是 可 以 想象 火星 表面 会 有 多 
样 化 的 地 形 情况 ,如 河流 、 巨 石 . 凹 坑 等 ,机 器 人 在 运动 过 程 中 会 遇 到 各 种 障碍 ;另外 ,火星 
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上 还 可 能 存在 一 些 未 知 的 动态 因素 (如 风暴 等 ) ,会 使 得 环境 的 状况 发 生变 化 。 概 括 起 来 ， 
火星 环境 具有 开放 ,动态 .不 可 知 、 难 控 等 特点 。 

为 了 简化 案例 的 开发 和 演示 ,可 以 将 机 器 人 探矿 的 区 域 ( 即 机 器 人 的 运动 环境 ) 简 化 
和 抽象 成 MX M 的 单元 格 ,每 个 单元 格 代表 某 个 火星 区 域 ,火星 矿产 分 布 在 这 些 单元 格 
中 ,同时 这 些 单元 格 中 还 存在 阻碍 机 器 人 运行 的 障碍 物 。 探 矿 机 器 人 在 这 些 网 格 中 运动 ， 
根据 感知 到 的 网 格 环境 信息 自主 地 决定 自身 的 行为 。 如 果 所 在 的 单元 格 有 矿产 , 则 采集 
矿产 ;如 果 探 测 到 附近 的 单元 格 存在 矿产 , 则 移动 到 该 单元 格 ;如 果 周 围 的 单元 格 存 在 障 
碍 物 , 则 避 开 这 些 障碍 物 。 环 境 网 格 有 两 个 特殊 的 单元 格 : 一 个 是 矿产 堆积 单元 格 ,用 于 
存放 机 器 人 采集 到 的 矿产 ,如 图 6-21 中 的 左下 角 ; 另 一 个 是 能 量 补充 单元 格 ,机 器 人 可 以 
从 该 单元 格 获得 能 量 。 
























































图 6-21 火星 探矿 机 器 人 案例 的 环境 示意 图 


“火星 探矿 机 器 人 ”的 设计 目标 是 要 采集 火星 矿产 ,并 将 其 带 到 预定 的 区 域 。 为 此 ,该 
机 器 人 具有 以 下 一 组 基本 能 力 。 

。 移动 。 它 能 够 在 火星 表面 移动 ,能 够 从 一 个 单元 格 移动 到 其 上 、 下 左右 的 相 邻 
单元 格 。 
探测 。 它 配备 了 多 种 传感器 ,具有 一 定 程度 的 环境 感知 能 力 ,具体 包括 探测 周围 
一 定 区 间 ( 如 相 邻 多 少 个 单元 格 ) 的 矿产 分 布 情况 以 及 障碍 物 情况 。 

。 采集 。 它 能 够 采集 所 在 单元 格 中 的 火星 矿产 。 

。 务 载 。 它 能 够 邱 载 其 采集 的 、 放 置 在 其 体内 的 矿产 。 

交互 。 它 能 够 与 其 他 的 机 器 人 进行 交互 和 协同 ,以 更 高 效 地 采集 矿产 。 例 如 ,一 
个 机 器 人 探测 到 大 面积 的 矿产 , 它 可 以 将 该 矿产 信息 告知 其 他 机 器 人 ,以 便 他 们 
能 够 来 该 区 域 采集 矿产 。 

为 了 充分 反应 探矿 机 器 人 的 实际 情况 ,我 们 对 机 器 人 作 了 以 下 假设 : 每 个 机 器 人 
存储 矿产 的 容量 都 有 一 定 的 限度 , 即 机 器 人 内 部 只 有 有 限 的 空间 存放 矿产 ,一 旦 机 器 人 采 
集 的 矿产 超出 其 存储 容量 , 它 必 须 将 这 些 矿产 印 载 到 特定 的 位 置 区 域 ,以 便 能 够 再 次 采集 
人 矿产。 四 每 个 机 器 人 的 能 量 都 有 一 定 的 限度 ,机 器 人 在 移动 .探测 .采集 、 印 载 等 过 程 中 会 
消耗 能 量 , 为 此 机 器 人 必须 在 其 能 量 消耗 殖 尽 之 前 补充 能 量 ( 如 充电 )。@ 每 个 机 器 人 的 
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感知 能 力 都 是 有 限度 的 , 它 只 能 够 感知 其 周围 一 定 范围 内 的 环境 状况 ,如 邻近 两 个 单位 的 
单元 格 。 

下 面 通 过 多 个 场景 描述 机 器 人 如 何在 上 述 火星 环境 下 采集 火星 矿产 ,这 些 场景 分 别 
描述 了 机 器 人 采矿 的 不 同 工 作 模式 ,反映 了 实现 这 些 自主 机 器 人 的 不 同 难 易 程 度 。 

场景 一 : 独立 采集 矿产 。 

在 该 场景 中 ,有 多 个 自主 机 器 人 参与 到 火星 矿产 的 采集 工作 中 ,每 个 机 器 人 都 有 移 
动 .探测 .采集 、 印 载 的 能 力 ,它们 在 火星 表面 随机 移动 ,根据 其 所 在 位 置 探 测 到 的 矿产 信 
息 和 障碍 物 等 环境 信息 自主 地 实施 行为 。 但 是 ,这 些 机 器 人 都 是 单独 工作 ,它们 之 间 没 有 
任何 交互 与 合作 。 因 此 ,可 以 将 本 场景 中 的 每 个 机 器 人 都 抽象 和 设计 为 自主 的 Agent。 

场景 二 : 合作 采集 矿产 。 

在 该 场景 中 ,有 多 个 自主 机 器 人 参与 到 火星 矿产 的 采集 工作 中 ,每 个 机 器 人 都 有 移 
动 . 探 测 . 采 集 、 印 载 的 能 力 ,它们 在 完成 各 自 矿 产 采 集 任 务 的 同时 ,相互 之 间 还 进行 交互 
和 合作 ,以 更 高 效 地 开展 工作 。 例 如 , 某 个 机 器 人 探测 到 大 片 的 矿产 信息 ,那么 它 可 以 将 
该 信息 告诉 给 其 他 机 器 人 ,或 者 请 求 其 他 机 器 人 来 该 区 域 采 矿 。 因 此 ,可 以 将 本 场景 中 的 
机 器 人 抽象 和 设计 为 由 多 个 自主 Agent 所 构成 的 多 Agent 系统 。 该 系统 的 设计 和 实现 
不 仅 要 考虑 到 各 个 自主 Agent, 还 要 考虑 到 这 些 Agent 之 间 的 交互 和 协同 。 

场景 三 : 多 角色 合作 采集 矿产 。 

在 该 场景 中 ,有 多 个 具有 不 同 职责 、 扮 演 不 同 角色 的 机 器 人 参与 到 火星 矿产 的 采集 工 
作 中 ,每 类 机 器 人 承担 矿产 采集 中 的 某 项 工作 (如 探测 采集) ,它们 之 间 通 过 交互 和 合作 
共同 完成 矿产 采集 任务 , 即 该 场景 有 多 种 类 型 的 机 器 人 ,包括 : 四 采矿 机 器 人 ,采集 矿产 
并 将 其 运送 到 指定 区 域 ; @ 探 测 机 器 人 ,负责 探测 矿产 并 将 其 探测 到 的 矿产 信息 通知 给 
采矿 机 器 人 。 因 此 ,可 以 将 本 场景 中 的 机 器 人 抽象 和 设计 为 由 多 个 自主 Agent 所 构成 的 
多 Agent 系统 。 该 系统 的 设计 和 实现 不 仅 要 考虑 到 各 个 自主 Agent, 还 要 考虑 到 这 些 
Agent 之 间 的 交互 和 协同 。 显 然 , 该 场景 比 前 一 个 场景 更 复杂 , 它 涉 及 的 Agent 类 型 和 数 
量 、 交 互 和 合作 关系 等 更 多 。 


6.8.2 设计 与 实现 


下 面 介绍 如 何 基 于 多 Agent 系统 的 开发 框架 JADE 开发 “火星 探矿 机 器 人 ”案例 。 

为 了 简化 设计 ,聚焦 于 Agent 的 构造 和 实现 ,“ 火 星 探矿 机 器 人 ”案例 中 的 环境 被 设 
计 为 一 个 MXM 的 网 格 ,每 个 网 格 单元 代表 了 一 个 地 理 位 置 ,不 同 网 格 单元 具有 不 同 的 
地 形 信息 ,可 能 存在 影响 机 器 人 移动 的 障碍 物 , 火 星 矿 产 非 均 匀 地 分 布 在 网 格 单元 格 中 。 
机 器 人 驻 留 在 网 格 环境 中 ,可 以 在 不 同 的 网 格 中 移动 ,感知 网 格 周围 的 环境 信息 ,如 矿产 、 
障碍 物 等 ,如 果 它 发 现 所 在 的 网 格 中 存在 矿产 ,那么 它 就 挖掘 矿产 。 

整个 应 用 的 界面 如 图 6-22 所 示 。 界 面 左 部 显示 了 机 器 人 所 在 的 环境 (用 网 格 来 表 
示 ), 它 提供 了 多 样 化 的 图 符 以 及 数字 信息 表示 环境 中 的 机 器 人 、 矿 产 、 障 碍 物 等 及 其 在 环 
境 中 的 分 布 情况 。 机 器 人 运行 在 网 格 中 ,因而 任何 时 刻 机 器 人 都 有 其 所 处 单元 格 的 位 置 。 
界面 的 右 部 显示 了 各 种 图 符 信息 的 说 明 以 及 系统 和 环境 中 机 器 人 、 矿 产 等 数量 的 变化 。 
界面 的 下 部 提供 整个 系统 运行 过 程 中 的 各 种 动态 信息 ,如 某 个 机 器 人 探测 到 矿产 、 机 器 人 





务 6 葛 4gent 一 287 一 一 
从 一 个 位 置 移动 到 另 一 个 位 置 等 。 


r 















































矿产 仓库 


色 斥 惠 Robo 坎 目 为 1 采矿 Robo 绕 目 为 1 
动 Jade tmain=true, port=8888} 
始 采 矿 
矿产 位 置 [1 3] | 
- E 


图 6-22 火星 探矿 多 Agent 系统 的 运行 界面 
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系统 在 初始 化 时 将 自动 生成 机 器 人 的 运行 环境 ,包括 矿产 、 障 碍 物 等 的 分 布 ,用 户 可 
以 根据 需要 配置 系统 运行 时 的 机 器 人 信息 ,包括 机 器 人 的 类 型 .数目 等 ,设置 机 器 人 的 基 
本 属性 ,如 机 器 人 的 观测 范围 .机 器 人 的 初始 能 量 值 等 。 在 实际 开发 中 ,我 们 具有 以 下 的 
基本 假设 : Agent 从 初始 位 置 出 发 在 地 图 上 随机 单 步 移动 , 遇 到 障碍 能 够 自动 避 开 ,能 自 
动 探测 到 其 周边 是 否 有 矿产 ,一 次 只 能 采集 一 个 矿产 并 将 其 运送 到 指定 的 矿产 仓库 。 

1. 环境 的 设计 与 实现 

我 们 设计 了 一 个 环境 类 (对 应 于 environment. java 文件 ) 表 示 和 处 理应 用 中 的 环境 。 
该 类 封装 了 以 下 一 组 属性 和 行为 。 
环境 中 的 矿产 ,定义 一 个 一 维 动态 数组 存放 矿产 的 位 置 ArrayList<Coordinate 盖 
MinePositions, 其 中 Coordinate 是 一 个 类 ,定义 了 网 格 的 坐标 。 
环境 中 的 障碍 物 ,定义 一 个 一 维 动态 数组 存放 障碍 物 的 位 置 ArrayList 
Coordinate> ObstaclePositions 。 
环境 中 的 机 器 人 ,ArrayList< BasicRobot> robots, 该 属性 定义 了 处 于 环境 中 的 
一 组 机 器 人 。 
。 InitEnv() 方 法 ,该 方法 生成 网 格 环境 并 随机 产生 环境 中 的 矿产 和 障碍 物 。 
2. 系统 中 的 Agent 和 行为 
根据 应 用 案例 描述 ,我 们 设计 了 如 图 6-23 所 示 的 一 组 Agent 和 行为 ,以 支持 场景 一 
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至 场景 三 的 实现 。 


3. 
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图 6-23 系统 中 的 Agent 及 其 行为 示意 图 


BasicRobot 是 一 个 基本 的 Agent 机 器 人 , 它 能 够 在 环境 中 行走 ,具有 随机 行走 
RandomWalkBev 的 行为 。 在 本 案例 中 , BasicRobot 无 须 生成 具体 的 Agent 实 
例 ,而 是 被 其 他 Agent 所 继承 。 

ExploreRobot 是 一 个 专门 为 场景 一 设计 的 Agent 机 器 人 , 它 继 承 了 “BasicRobot” 
Agent 的 属性 、 方 法 和 行为 ,具有 探测 矿产 DetectMineBev、 采集 矿产 
DigMineBev、 转 存 矿产 DumpMineBev 3 个 行为 。 也 就 是 说 ,该 Agent 可 以 独立 
完成 探矿 、 采 矿 和 存 矿 的 功能 。 但 是 ,ExploreRobot 不 具有 与 其 他 Agent 交互 和 
协同 的 能 力 。 在 场景 一 ,系统 可 能 会 产生 一 个 或 者 多 个 “ExploreRobot”Agent 机 
器 人 。 

ExploreCoopRobot 是 一 个 专门 为 场景 二 设计 的 Agent 机 器 人 , 它 继 承 了 
“ExploreRobot”Agent 的 属性 、 方 法 和 行为 ,同时 具有 交互 协同 CooperationBev 
行为 ,能 够 与 其 他 Agent 机 器 人 进行 协同 ,以 告知 所 探测 的 矿产 信息 。 在 场景 二 
中 ,系统 可 能 会 产生 一 个 或 者 多 个 “ExploreCoopRobot”Agent 机 器 人 。 
场景 三 包含 两 类 不 同 的 Agent 机 器 人 : 一 类 是 专门 探矿 的 机 器 人 DetectMineRobot， 
它 具 有 探测 矿产 DetectMineBev 交互 协同 CooperationBev 两 个 行为 ,可 以 实现 探矿 
并 将 所 探测 到 的 矿产 信息 告诉 给 其 他 的 Agent 机 器 人 ; 另 一 类 是 DigMineRobot, 它 
具有 采集 矿产 DigMineBev、 转 存 矿产 DumpMineBev、 交 互 协同 CooperationBev 3 个 
行为 ,能 够 实施 采矿 . 存 矿 等 功能 ,处 理 其 他 Agent 发 送 过 来 的 消息 ,并 将 采矿 信息 
告诉 给 环境 中 的 其 他 Agent 机 器 人 。 

Agent 类 的 设计 与 实现 


Agent 类 的 设计 与 实现 需要 注意 以 下 几 点 : @ 继 承 Agent 类 或 者 其 子 类 ; @ 在 构造 函 


数 中 初始 化 Agent 的 基本 属性 ; @ 在 Setup 〇 方法 中 通过 addBehaviour() 语 句 给 Agent 增加 
相应 的 行为 ,以 便 Agent 创建 后 就 可 执行 这 些 行为 。 下 面 以 “ExploreRobot”Agent 为 例 介绍 
如 何 设计 和 实现 Agent。 


任何 Agent 类 都 要 继承 JADE 的 Agent 类 或 者 其 子 类 ,如 BasicRobot 继承 了 Agent 
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类 ,其 代码 框架 如 下 所 示 。 


import jade.core.Agent; 
public class BasicRobot extends Agent { 


} 
“ExploreRobot”Agent 则 继承 了 “BasicRobot”Agent, 而 “BasicRobot”Agent 是 
Agent 类 的 子 类 ,该 部 分 的 代码 框架 如 下 所 示 。 


import jade.core.Agent; 
public class ExploreRobot extends BasicRobot { 


} 


在 每 个 Agent 的 构造 函数 部 分 ,程序 员 需 要 针对 Agent 的 一 些 属性 完成 初始 化 工 
作 。 例 如 ,对 于 每 一 个 “ExploreRobot”Agent 而 言 , 当 其 实例 化 之 后 ,需要 为 其 随机 生成 
该 Agent 机 器 人 在 环境 ( 即 网 格 ) 中 的 位 置 ,同时 需要 初始 化 该 机 器 人 所 获得 环境 中 矿产 
的 信息 。 该 部 分 的 代码 框架 描述 如 下 。 

import jade.core.Agent; 

public class ExploreRobot extends BasicRobot { 

Coordinate position; 

ArrayList< Coordinate > FoundMine; 


public ExploreRobot () { 


position =env.CreateRandomPosition(); 
FoundMine =new ArrayList< Coordinate > (); 


} 


其 中 ,position 是 一 个 类 型 为 Coordinate 的 属性 , 它 定义 了 Agent 机 器 人 在 网 格 中 的 
坐标 ;FoundMine 是 一 个 类 型 为 Coordinate 的 动态 数组 .定义 了 Agent 机 器 人 探测 到 的 
矿产 位 置信 息 。 在 上 述 语 句 中 ,CreateRandomPosition() 是 一 个 产生 随机 环境 位 置 的 方 
法 ,FoundMine 二 new ArrayList 过 Coordination 二 () 语 句 则 产生 一 个 类 型 为 Coordinate 
的 动态 数组 。 

Agent 类 的 设计 通常 需要 实例 化 setupQ 〇 方法。 针对 本 案例 ,我 们 需要 在 该 方法 中 增 
加 一 组 行为 ,以 便 让 ExploreRobot 在 创建 之 后 就 可 执行 这 些 行 为 ,其 代码 框架 描述 如 下 。 


import jade.core.Agent; 
public class ExploreRobot extends BasicRobot { 


public void setup() { 
addBehaviour (new DetectMineBehaviour (this)); 
addBehaviour (new DigMineBehaviour (this)); 
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addBehaviour (new DumpMineBev (this)); 
} 


$ 


其 中 ,语句 addBehaviour(new DetectMineBehaviour(this)); 旨 在 增加 一 个 探测 矿产 
的 行为 ,语句 addBehaviour(new DigMineBehaviour(this)); 旨 在 增加 一 个 挖 矿 的 行为 , 语 
句 addBehaviour(new DumpMineBev (this)); 旨 在 增加 一 个 卸载 矿产 到 矿产 仓库 的 
行为 。 

4. 行为 类 的 设计 与 实现 

行为 类 的 设计 与 实现 需要 注意 以 下 几 点 : 分 析 待 实现 行为 的 特点 ,确定 该 行为 类 
应 继承 什么 样 的 基 类 行为 ; @ 在 public void action() 方 法 中 编写 具体 的 行为 代码 。 下 面 
以 DetectMineBehaviour 行为 为 例 介 绍 如 何 设计 和 实现 行为 。 

首先 ,DetectMineBehaviour 行为 旨 在 探测 Agent 周边 是 否 存在 矿产 ,这 种 探测 需要 
不 断 地 进行 ,因而 该 行为 属于 一 类 周期 性 行为 ,需要 继承 JADE 中 的 CyclicBehaviour 类 ， 
其 代码 框架 如 下 所 示 。 

import jade.core.Agent; 

import jade.core.behaviours.CyclicBehaviour; 


public class DetectMineBev extends CyclicBehaviour { 
public DetectMineBev (BasicRobot robot) { 


} 
public void action() { 


} 
} 


其 中 ,DetectMineBev() 是 构造 函数 ,可 以 完成 一 些 初始 化 的 工作 ;public void action() 定 
义 了 行为 体 。 

其 次 ,需要 在 public void action() 方 法 中 定义 行为 的 程序 代码 。 对 于 DetectMineBev 行 
为 而 言 ,其 行为 部 分 主要 是 要 获得 其 当前 所 在 位 置 的 周围 是 否 存在 矿产 ,如 果 存 在 , 则 将 这 
些 矿 产 信息 ( 即 矿产 所 在 的 坐标 ) 加 入 到 Agent 机 器 人 的 FoundMine 动态 数组 中 。 

5. Agent 间 交 互 的 设计 与 实现 

场景 二 和 场景 三 都 涉及 Agent 机 器 人 之 间 的 交互 和 协同 。 下 面 以 场景 三 中 的 
DetectRobot 为 例 ,介绍 如 何 实现 Agent 之 间 基 于 FIPA ACL 的 交互 和 协同 。 一 旦 某 个 
DetectRobot 探测 到 某 些 矿产 , 它 需 要 将 它 所 探测 到 的 矿产 信息 通知 给 环境 中 的 
“DigRobot”Agent 机 器 人 。 下 面 的 程序 代码 描述 了 Agent 机 器 人 在 DetectMineBehaviour 行 
为 中 如 何 给 其 他 的 Agent 发 送 所 探测 到 的 矿产 信息 。 

首先 ,通过 new ACLMessage(ACLMessage. INFORM) 语 句 产 生 一 个 “通知 ”类 型 的 
ACL 消息 ,其 次 将 矿产 坐标 作为 该 消息 的 内 容 , 然 后 将 其 他 Agent 加 入 到 消息 的 接收 者 
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列表 中 ,最 后 发 送 该 ACL 消息 。 
public class DetectMineBehaviour extends CyclicBehaviour { 
// 行 为 体 
public void action() { 


Coordinate target =RandomWalkBev.RandomNextpoint (ui.myGrid); 
int RobotNum =en.getrabotarryList() .size(); 


// 生 成 消息 类 型 
RCIMessage msg = new ACLMessage (ACIMessage .INFORM) ; 
// 生 成 消息 内 容 
for (int i= 0;i<en.getMinePositions () .size();i++){ 
targetposi.x= en.getMinePositions() .get (i).x; 
targetposi.y= en.getMinePositions() .get (i).y; 
try { 
msg.setContentObject ( (Serializable) targetposi); 
} catch (IOException e) { 
//TODO Auto- generated catch block 
e.printstackTrace (); 
} 
// 生 成 消息 的 接收 者 
for (int i=0;i<en.getrobotArryList () .size();i++){ 
msg.addReceiver (new AID ("Dig"+i, AID.ISLOCALNAME)); 
3 
thisRobot .send (msg) ;// 发 送 消息 


6.9 小 结 


多 Agent 系统 研究 如 何在 一 群 自主 的 Agent 间 进 行 智能 行为 的 协调 ,具有 更 大 的 灵 
活性 ,更 能 体现 人 类 社会 智能 ,更 加 适应 开放 和 动态 的 世界 环境 。 根 据 人 类 思维 的 不 同 层 
次 ,可 以 把 Agent 分 为 反应 式 、 慎 思 式 、 跟 踪 式 、 基 于 目标 的 、 基 于 效果 的 和 复合 式 Agent。 

20 世纪 90 年 代 后 期 ,研究 人 员 开 始 在 不 断 拓宽 的 现实 领域 寻求 多 Agent 系统 的 新 
发 展 。 机 器 人 世界 杯 (RoboCup) 应 运 而 生 。 举 行 RoboCup 比赛 的 目标 是 ,在 50 年 内 ， 
产生 出 一 支 能 够 战胜 具有 世界 杯 水 准 的 人 类 球 队 的 机 器 人 足球 队 。 其 出 发 点 是 ,从 理论 
上 说 一 支出 色 的 球 队 需要 一 系列 技能 ,如 利用 有 限 的 带宽 进行 实时 动态 的 协作 ,机 器 人 球 
队 如 果 能 战胜 人 类 球 队 ,标志 多 Agent 系统 在 技术 和 理论 上 有 根本 的 突破 。 参 加 
RoboCup 的 热度 在 世纪 之 交 暴涨 ,定期 举办 的 RoboCup 锦标 赛 吸 引 了 来 自 世 界 各 地 的 
数 百 支 参赛 队伍 。2000 年 ,RoboCup 推出 了 一 项 新 的 活动 一 一 RoboCup 营救 。 这 项 活 
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动 以 1995 年 发 生 的 日 本 神户 大 地 震 为 背景 ,目标 是 建立 一 支 能 够 通过 相互 协作 完成 搜救 
任务 的 机 器 人 队伍 。 

在 世纪 之 交 , 以 Agent 为 媒介 的 电子 商务 成 为 Agent 技术 的 最 大 单一 应 用 场合 ， 
Agent 系统 在 谈判 和 拍卖 领域 的 发 展 提供 了 巨大 推动 力 。2000 年 以 后 ,以 促进 和 鼓励 高 
质量 的 交易 Agent 研究 为 目的 的 交易 Agent 竞赛 推出 并 吸引 了 很 多 研究 人 员 参 与 。 

自 2001 年 以 来 ,多 Agent 系统 的 思想 对 主流 计算 机 科学 产生 了 深远 影响 ,拍卖 和 机 
制 设计 等 研究 领域 已 经 跻身 理论 计算 机 科学 的 主要 课题 。 这 些 突破 性 进展 首先 源 于 易趣 
(eBay) 等 在 线 拍卖 行 的 巨大 成 功 ,但 更 普遍 的 是 许多 有 趣 的 、 重 要 的 组 合 问题 都 可 以 表 
示 为 拍卖 。 对 博弈 论 和 计算 机 科学 之 间 关 联 性 的 研究 同样 高 涨 。2008 年 ,国际 博弈 论 学 
会 特意 为 最 佳 博弈 论 与 计算 机 科学 交叉 研究 设立 了 一 个 新 的 奖项 。 在 多 Agent 系统 领 
域 涌现 并 得 到 应 用 的 思想 还 包括 : 社会 科学 领域 复杂 分 布 式 系统 建 模 的 多 Agent 模拟 技 
术 、 形 式 化 描述 分 布 式 系统 的 DEC-POMDP 以 及 个 人 协助 技术 。 同 时 ,下 一 代 分 布 式 传 
感 器 .网络 化 自动 驾驶 车 辆 和 机 器 人 系统 .自主 计算 以 及 网 络 服务 等 未 来 多 Agent 技术 
更 广阔 的 应 用 场景 正 展 现在 我 们 面前 。 

美国 工程 院 院士, 哈佛 大 学 Barbara Grosz 教授 在 报告 (多 Agent 系统 的 “图 灵 挑 
战 ?》(A Mulri-Agent Systems “Turing Challenge”) 中 提出 “多 Agent 图 灵 测 试 ” 问 题 : 
一 群 Agent 是 否 能 够 在 动态 ,不 确定 的 环境 中 表现 得 像 一 群 人 一 样 。 此 问题 可 以 看 作 经 
典 图 灵 测 试 的 扩展 。 尽 管 过 去 几 十 年 已 经 有 很 多 关于 多 Agent 协同 、 合 作 以 及 处 理 对 抗 
性 或 策略 性 环境 的 研究 成 果 , 但 当前 的 多 Agent 技术 还 难以 应 对 复杂 情况 下 的 新 挑战 。 
我 们 需要 更 善于 与 人 一 起 工作 的 Agent, 并 且 这 样 的 需求 越 来 越 强 烈 和 普遍 。 未 来 的 多 
Agent 系统 研究 将 继续 关注 规划 .学习 .协调 、 机 制 设计 .人 机 交互 等 众多 理论 问题 。 同 
时 ,未 来 的 研究 将 面向 安全 、 可 持续 发 展 、 医 疗 、 老 龄 化 等 现实 挑战 。 


习题 


6.1 分 布 式 人 工 智 能 系统 有 何 特点 ? 试 与 多 Agent 系统 的 特性 加 以 比较 。 

6.2 什么 是 Agent? Agent 有 哪些 特性 ? 

6.3 Agent 在 结构 上 有 何 特点 ? Agent 在 结构 上 又 是 如 何 分 类 的 ?每 种 结构 的 特点 是 

什么 ? 

什么 是 反应 式 Agent? 什么 是 慎 思 式 Agent? 比较 两 者 的 区 别 。 

简 述 Agent 通信 的 步 又、 类 型 和 方式 。 

阐述 移动 Agent 的 主要 实现 技术 。 

多 Agent 系统 有 哪儿 种 基本 模型 ? 其 体系 结构 又 有 哪 几 种 ? 

试 说 明 多 Agent 系统 的 协作 方法 、 协 商 技术 和 协调 方式 。 

为 什么 多 Agent 系统 需要 学 习 与 规划 ? 

10 ”你 认为 多 Agent 系统 的 研究 方向 应 是 哪些 ? 其 应 用 前 景 又 如 何 ? 

11 选择 一 个 你 熟悉 的 领域 ,编写 一 页 程序 描述 Agent 与 环境 的 作用 。 说 明 环 境 是 否 
是 可 访问 的 、 确 定性 的 、 情 节 性 的 ,静态 的 和 连续 的 。 对 于 该 领域 ,采用 何 种 Agent 
结构 为 好 ? 
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设计 并 实现 几 种 具有 内 部 状态 的 Agent, 并 测试 其 性 能 。 对 于 给 定 的 环境 ,这 些 
Agent 如 何 接近 理想 的 Agent? 

采用 Agent 思想 和 技术 设计 家 庭 安 全 智能 信息 系统 。 

(思考 题 ) 仔 细 阅 读 和 理解 “家 庭 安全 智能 信息 系统 ”的 需求 (6. 13 题 ), 细 化 和 完善 
有 关 * 视 频 图 像 *Agent 的 应 用 场景 描述 ,利用 JADE 以 及 开源 的 面部 图 像 识 别 软 
件 开发 “视频 图 像 ?Agent 软件 。 

【提示 】 设 计 “ 视 频 图 像 *Agent 的 行为 ;设计 “视频 图 像 *”Agent 与 其 他 Agent( 如 
“通知 Agent”“ 用 户 Agent”) 之 间 的 ACL 交互 协议 和 消息 ;在 互联 网 上 查找 有 关 
面部 图 像 识别 的 开源 软件 ,分 析 这 些 不 同 开源 软件 的 特点 ,从 中 优选 一 个 面部 图 像 
识别 软件 。 

(思考 题 ) 请 从 所 驻 留 环境 的 特点 、 内 部 结构 ,行为 实施 方式 等 多 个 方面 分 析 Agent 
与 专家 系统 二 者 之 间 有 何 区 别 ? 

(思考 题 ) 如 果 将 Agent 的 行为 决策 视 为 一 个 定理 证 明 的 过 程 ,请 分 析 和 解释 
Agent 内 部 的 状态 如 何 表示 ,行为 决策 算法 如 何 实现 ,尝试 利用 现 有 的 定理 证 明 器 
封装 和 实现 一 个 Agent。 

(思考 题 )Agent 之 间 的 交互 可 以 基于 ACL 进行 (如 JADE) ,也 可 以 采用 传统 的 事 
件 机 制 或 者 消息 传递 方法 (如 JACK) ,请 分 析 这 两 种 实现 方法 的 优 缺点 。 
(思考 题 ) 多 Agent 编程 竞赛 活动 的 目的 之 一 是 要 寻求 如 何 基于 多 Agent 系统 技 
术 解 决 实际 问题 ,进而 推动 智能 主体 和 多 主体 系统 在 诸多 领域 的 实际 应 用 ,其 网 址 
是 https://multiAgentcontest. org/ ,分 析 该 竞赛 欲 解决 的 问题 及 其 应 用 场景 。 
(思考 题 ) 请 针对 6. 8. 1 节 “ 火 星 探 矿 机 器 人 ”场景 三 的 描述 ,利用 JADE 设计 和 实 
【提示 了 不 同 于 场景 一 和 场景 二 ,场景 三 涉及 多 个 不 同类 型 的 Agent, 因 为 需要 实现 
多 个 Agent 类 ;不 同类 型 的 Agent 之 间 存 在 交互 ,因此 需要 设计 和 实现 它们 之 间 
的 ACL 消息 以 及 协同 行为 。 

(思考 题 ) 军 队 需 要 迅速 有 效 地 调动 人 员 、 装 备 和 后 勤 物资 ,以 便 为 高 技术 条 件 下 
的 局 部 战争 提供 保障 。 可 以 将 合作 自主 Agent 技术 应 用 到 国防 运输 活动 中 。 由 
近 地 轨 道 卫 星 提 供 的 全 球 通信 系统 可 用 于 跟踪 运输 情况 ,并 不 断 更 新 其 共享 知识 
库 。 在 国防 运输 系统 中 ,采用 Agent 规划 运输 路 线 很 有 效 , 这 些 Agent 可 监控 运 
输 路 线 ,改变 运输 工具 。 

设计 两 类 Agent: 一 类 是 动态 智能 Agent' 与 运输 装置 相关 ,如 集装箱 .装备 或 人 员 
舱室 ,其 中 的 每 项 物资 .每 箱 军 需 品 及 每 件 军火 都 可 以 认为 是 Agent, 其 唯一 目标 
就 是 在 可 能 的 最 好 条 件 下 以 最 省 时 的 方式 到 达 目 的 地 ; 另 一 类 是 静态 Agent, 其 作 
用 是 为 运输 物资 安排 运输 方式 ,竞争 有 限 的 运输 ,存储 和 装 印 资源 ,避免 或 解决 与 
其 他 Agent 的 冲突 。 

(思考 题 ) 查阅 资料 ,论述 Agent 技术 在 作战 仿真 中 的 应 用 。 

提示 : 参考 本 书 文献 [15], 基于 多 Agent 的 方法 ,构成 了 该 书 作 战 仿真 模型 
EINSTtein 的 理论 基础 ,赋予 各 个 士兵 ( 即 Agent) 独 特 的 个 性 ,定义 各 Agent 的 交 
互 规则 ,然后 让 整个 多 Agent 系统 自己 演化 。 
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(思考 题 ) JADEX 是 一 个 基于 JADE 支持 AgentBDI 体系 结构 的 多 Agent 系统 开 
发 框架 。 它 采用 XML Java 相 结 合 的 方式 编写 具有 认 知 结构 、 可 实现 行为 推理 的 
Agent, 学 习 使 用 JADEX 开发 多 Agent 系统 。 

【提示 】 下 载 并 安装 JADEX 开源 软件 代码 ,阅读 该 软件 的 编程 手册 ,尝试 利用 
JADEX 提供 的 BDI 模型 (而 非 JADE 的 反应 式 模型 ) 实 现 “ 火 星 探矿 机 器 人 ”, 并 
与 JADE 进行 对 比 ,分 析 这 种 开发 框架 的 优势 和 不 足 。 

(思考 题 ) 火 星 探 测 者 Agent。 该 问题 最 初 是 由 Luc Steels 提出 的 ,其 目标 是 要 设 
计 一 组 机 器 人 Agent 对 火星 表面 进行 探测 ,并 带 回 火星 上 的 一 些 重要 的 岩石 
样本 。 

探测 者 Agent 首先 由 一 稻 母 船 将 其 带 到 火星 表面 , 母 船 将 其 释放 出 来 以 后 它们 将 
在 火星 表面 自主 移动 ,以 搜寻 所 需 的 岩石 标本 。 由 于 火星 表面 地 形 复杂 ,会 有 坑 洼 
和 障碍 物 ,如 山川 河流、 岩洞 等 ,因而 探测 者 Agent 在 移动 过 程 中 需要 对 前 方 的 
地 形 情 况 进 行 感知 。 一 旦 发 现 前 方 不 可 通过 ,就 及 时 改变 运动 方向 。 此 外 ,如 果 探 
测 者 Agent 发 现 了 岩石 样本 ,那么 它 需 将 该 岩石 样本 置 于 其 体内 并 返回 母 船 。 母 
船 可 以 发 出 功率 强大 的 信号 告诉 各 个 探测 者 Agent 其 所 在 的 方位 ,从 而 引导 它们 
返回 母 船 ( 图 6-24) 。 
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图 6-24 ”探测 者 Agent 在 火星 表面 自主 移动 以 探测 和 获取 火星 岩石 样本 


在 Agent 到 达 火 星之 前 ,探测 者 Agent 的 设计 者 和 探测 者 Agent 本 身 没有 任何 有 
关 火 星 表面 地 形 的 信息 ,也 不 知 岩 石 样 本 会 散布 在 火星 表面 的 哪些 位 置 。 设 计 者 
在 设计 探测 者 Agent 之 时 知道 的 仅仅 是 岩石 样本 在 火星 表面 不 是 均匀 分 布 的 。 
因此 ,探测 者 Agent 在 火星 上 需要 完全 自主 地 运作 (而 不 是 预先 已 经 设计 好 的 )， 
以 处 理 各 种 意 想不到 的 情况 ,从 而 实现 其 设计 目标 。 

此 外 ,为 了 提高 火星 探测 的 效率 和 质量 ,确保 在 一 次 飞行 中 能 用 较 短 的 时 间 获 得 更 
多 的 火星 岩石 样本 , 母 船 一 次 性 释放 多 个 探测 者 Agent。 设 计 者 要 求 这 些 探测 者 
Agent 在 火星 表面 能 够 相互 合作 ,以 更 好 地 完成 火星 探测 任务 。 例 如 , 当 一 个 探测 
者 Agent 在 某 个 区 域 发 现 岩 石 样本 时 , 它 将 通过 某 种 方式 通知 其 他 探测 者 Agent， 
以 便 其 他 探测 者 Agent 能 够 移动 到 该 区 域 , 以 获取 岩石 样本 。 
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问题 是 要 为 探测 者 Agent 设计 其 控制 结构 ,使 得 它 在 火星 表面 能 够 按照 上 述 方式 
自主 地 运行 并 完成 其 火星 探测 任务 。 
提示 : @ 构 造 具有 反应 式 体系 结构 的 Agent。 回 设计 反应 式 Agent 的 行为 集合 并 
对 这 些 行为 进行 合理 组 织 。 通 过 设计 探测 者 Agent 的 一 组 行为 以 实现 单个 Agent 
的 任务 ,然后 ,在 此 基础 上 通过 进一步 调整 其 行为 ,以 实现 多 个 探测 者 Agent 之 间 
的 合作 。 图 根据 其 设计 目标 ,探测 者 Agent 必须 具备 以 下 的 感知 能 力 : 感知 前 方 
的 障碍 物 ,感知 岩石 样本 和 感知 母 船 位 置 等 ;同时 应 具有 以 下 动作 : 向 前 移动 , 改 
变 方向 ,将 岩石 样本 放置 于 其 体内 ,释放 体内 的 岩石 样本 等 。 
(思考 题 ) 用 于 电力 管理 的 多 Agent 系统 。 
(1) 企业 环境 。 
电力 制造 行业 正经 历 着 一 个 从 受 管制 .化 断 到 动态 开放 、 自 由 竞争 市 场 环 境 下 的 商 
业 运 作 的 转变 。 因 而 ,对 该 行业 而 言 ,一 种 新 的 商业 模式 正在 出 现 。 以 往 的 发 电 、 
配 电 以 及 按 千 瓦 时 给 客户 计 费 的 业务 ,本 质 上 完全 是 一 种 面向 产品 的 交 货 概念 , 目 
前 这 种 概念 正在 发 生变 化 。 能 源 企业 给 用 电 客 户 提供 了 各 种 增值 服务 (图 6-25)， 
包括 自动 测量 、 远 程 收费 ,优化 用 电 咨 询 、 价 格 裁定 、 合 同 签订 、 家 庭 自 动 化 和 家 庭 
电力 管理 等 。 这 种 模式 的 转变 带 来 了 新 的 机 遇 , 但 对 大 多 数 能 源 企业 来 说 ,也 必须 
用 新 的 思考 方式 想 问 题 ,这 一 商业 模式 需要 供需 双方 的 双向 通信 。 在 此 环境 下 ,能 
源 企 业 对 信息 与 知识 的 合理 应 用 是 在 市 场 竞争 中 取胜 的 关键 。 传 统 的 电能 配送 网 
必须 辅 以 相应 的 信息 网 络 ,以 允许 供 需 双方 进行 广泛 的 双向 通信 ,从 而 提供 上 述 各 
种 增值 服务 。 信 息 与 通信 技术 (ICT) 是 其 中 的 关键 。 
千瓦 时 
能 源 企业 | 客户 能 源 企业 | + 客户 
信息 
图 6-25 能 源 企 业 商 业 模式 的 转变 : 从 纯粹 的 产品 供应 到 面向 客户 的 双向 服务 









































近年 来 , 随 着 信息 与 通信 技术 的 发 展 ,给 电网 (包括 220, 还 有 其 他 子 站 、 工 业 负 载 
甚至 家 用 设备 ) 中 许多 不 同类 型 的 结 点 进行 装备 ,使 它们 自身 具备 关键 的 通信 与 计 
算 能 力 ,在 技术 与 经 济 上 都 已 成 为 可 能 。 这 样 ,电网 中 的 各 结 点 就 有 能 力 代 表 客 户 
与 企业 ,成 为 智能 的 有 交互 能 力 的 主体 (Agent)。 这 里 ,许多 高 端 技术 的 综合 应 用 
起 了 关键 作用 ,例如 ,能 嵌入 不 同 设备 中 的 廉价 的 可 编程 芯片 ,高 级 远程 通信 技术 ， 
知识 工程 与 软件 工程 。 对 象 与 知识 技术 以 及 多 主体 系统 技术 ,正在 出 现 的 用 于 电 
力 网 格 服务 的 设施 和 标准 ,可 算是 集成 化 的 信息 基础 设施 。 

某 大 型 项 目 信 息 社会 电能 系统 (Information Society Energy System,ISES) 已 为 提 
供 基 于 上 述 高 新 技术 的 新 型 服务 进行 了 研究 与 开发 。 可 预见 的 新 服务 应 用 之 一 
是 ,电网 中 的 各 结 点 自身 充当 智能 Agent 对 电能 进行 管理 。 我 们 称 这 种 智能 
Agent 为 Homebots。 电 能 管理 将 产生 如 下 效果 : 对 企业 而 言 ,由 于 电网 峰值 负载 
的 降低 ,可 以 更 有 效 地 利用 电力 网 格 ;对 用 电 客 户 来 说 ,在 保证 正常 用 电 的 情况 下 ， 
节省 了 总 体 电能 消耗 。 

这 也 给 供应 方 提供 了 对 配送 网 格 中 的 用 电 需 求 信息 进行 保存 和 对 负载 进行 管理 的 


——— 
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机 会 。 改 善 的 需求 信息 保存 和 负载 管理 能 够 大 幅 减少 能 源 企 业 的 投资 。 与 此 同 
时 ,它们 也 给 客户 带 来 了 利益 ,因为 利用 灵活 的 价格 与 合同 手段 ,也 可 以 降低 客户 
的 开销 。 

(2) 智能 多 Agent 系统 解决 方案 。 

现 有 的 能 源 负载 管理 形式 仅 限于 几 个 大 型 的 服务 设施 ,原因 在 于 手工 控制 管理 还 
是 起 着 重要 作用 。 多 Agent 系统 负载 管理 带 来 的 好 处 是 : 更 高 程度 的 自动 化 ,更 
大 的 规模 ,更 加 灵活 以 及 分 布 负载 更 合理 。 

借助 软件 Agent 技术 实现 自动 动态 的 负载 平衡 是 一 种 新 方法 。 通 过 给 电网 中 的 
设备 提供 具有 网 络 与 通信 能 力 的 微 处 理 器 以 及 相应 的 智能 软件 ,它们 可 以 获得 通 
信和 与 信息 处 理 能 力 。 目 前 ,让 通信 设备 在 软件 技术 的 帮助 下 ,通过 低压 网 格 或 者 其 
他 介质 进行 相互 “交谈 “协商 “决策 ”以 及 “协作 ”是 可 能 的 。 这 也 给 能 源 管 理 带 来 
了 新 的 思路 。 

按照 这 种 理念 ,我 们 可 以 通过 一 些 智 能 设备 的 相互 协作 实现 电网 的 分 布 式 负载 管 
理 。 知 识 与 通信 技术 是 实现 系统 智能 的 关键 。 

任何 设备 (负载 ), 如 加 热 器 .散热 器 和 热水器 等 都 可 以 由 软件 主体 ( 称 为 
Homebots) 表 示 , 它 在 照顾 用 户 喜 好 的 同时 有 效 地 优化 能 源 的 使 用 。 为 进行 负载 
管理 ,设备 间 的 通信 与 交互 采用 了 计算 市 场 的 形式 ,而 市 场 中 的 设备 可 以 买卖 能 
源 ,这 是 Homebots 的 主要 设计 理念 。 各 设备 Agent 间 以 一 种 类 似 自由 市 场 中 拍 
卖 的 方式 进行 通信 与 协商 ,对 客户 与 能 源 企 业 来 说 既 能 够 降低 能 源 消耗 ,也 可 以 节 
约 开支 。 像 拍卖 这 样 的 市 场 模式 给 自动 化 管理 大 型 的 分 布 式 系统 提供 了 新 概念 。 
这 是 一 种 减少 峰值 负载 的 方法 。 

给 Agent 分 配 任务 的 一 般 过 程 如 下 。 首 先 ,代表 能 源 供 应 者 的 软件 Agent( 如 变 电 
站 一 级 的 ) 向 用 户 Agent( 该 Agent 可 能 代表 一 个 智能 的 电子 测量 仪 ,该 仪器 可 能 
是 家 用 的 .工厂 里 的 ,或 者 是 装置 于 如 散热 器 之 类 的 设备 中 ) 宣 布 一 个 能 源 负 载 管 
理 动作 的 开始 。 例 如 ,假设 能 源 供 应 者 为 了 降低 当前 的 耗 电量 , 供 方 Agent 可 以 
提供 一 个 新 的 价格 ( 表 ) , 据 此 ,用 户 Agent 就 可 以 决定 是 否 参与 此 项 负载 管理 活 
动 。 当 然 , 这 取决 于 客户 的 喜好 ,也 可 以 由 客户 通过 程序 设 定 和 更 改 。 基 于 此 , 客 
户 Agent 也 可 以 出 售 能 源 (也 就 是 延迟 或 减少 电力 使 用 ), 以 获得 由 能 源 企 业 提供 
的 回扣 。 可 以 通过 拍卖 的 方式 实现 分 布 式 负载 管理 ,其 中 代理 企业 与 客户 的 软件 
Agent 通过 投标 与 协商 进行 电能 的 买卖 。 

同 自由 竞争 市 场 中 的 情况 一 样 ,所 有 标的 也 会 在 拍卖 中 受到 评估 ,而 拍卖 的 结果 就 
是 可 用 能 源 的 再 分 配 。 在 该 系统 中 ,能 源 是 一 种 可 买卖 的 资源 或 商品 。 在 负载 管 
理 活 动 中 ,存在 一 定量 的 能 源 供 应 。 供 需 双方 都 有 自身 的 需求 ,并 且 都 愿意 为 此 提 
供 相 应 的 参考 价格 。 然 而 ,双方 列 利 多 寡 最 终 以 什么 价格 成 交 , 则 需要 在 拍卖 中 动 
态 确定 。 

在 计算 机 上 实现 拍卖 过 程 时 ,应 用 了 相关 的 微观 经 济 理论 。 客 户 的 喜好 体现 于 用 
公用 函数 表示 的 框架 中 ,用 数字 表示 它们 想 出 的 价格 ,价格 越 高 表明 需求 越 迫 切 。 
因为 该 理论 具有 严格 的 数学 形式 ,所 以 可 用 程序 实现 。 评 估 市 场 收 支 平衡 情况 的 
相关 算法 可 用 数值 分 析 与 优化 技术 实现 (因为 市 场 机 制 的 问题 可 以 转化 最 优 搜索 





务 6 葛 Agent 一 一 297 


问题 ) 。 
市 场 协商 与 计算 过 程 一 直 进 行 ,直到 市 场 达 到 平衡 , 即 直 到 拍卖 中 的 供需 持平 为 
止 。 这样 ,以 所 获得 的 能 源 与 支出 的 财务 预算 比 来 衡量 ,拍卖 中 的 各 方 都 获得 了 最 
佳 的 交易 。 相 应 地 ,经 济 市 场 上 的 平衡 也 可 以 通过 可 用 能 源 在 设备 主体 中 的 最 优 
分 配 体现 出 来 。 达 到 平衡 后 ,一 切 买卖 过 程 都 将 结束 ,负载 管理 过 程 就 告 一 段落 。 
拍卖 结束 后 ,其 结果 将 通知 给 其 中 的 所 有 Agent( 也 就 是 达到 市 场 平衡 时 的 能 源 分 
配 )。 随 后 , 供 方 将 为 下 一 时 段 ( 如 一 小 时 ) 的 负载 作 相 应 调度 。 调 度 可 以 通过 远程 
通信 技术 远程 控制 相关 的 开 / 关 切换 完成 。 然 后 ,供需 双方 对 调度 结果 进行 监视 ， 
并 将 一 些 拍 卖 中 签订 的 合同 信息 存 和 数据库。 上 述 整 个 过 程 都 是 自动 进行 的 。 
(3) Homebots 主体 间 的 通信 规划 。 

图 6-26 给 了 一 个 对 话 图 ,这 是 一 个 Homebots 系统 通信 规划 的 非 形式 化 任务 描 
述 。 以 下 是 一 些 负载 管理 中 重要 的 通信 事务 和 相应 的 输入 /输出 信息 对 象 : @ 拍 
卖 开 始 : 发 送 触 发 信号 给 客户 主体 ,开始 一 个 负载 管理 动作 ; @ 递 交 标 书 : 客户 主 
体 将 标书 发 送 给 拍卖 方 进行 进一步 处 理 ; 四 公布 电力 分 配 : 告知 客户 主体 拍卖 结 
果 ; @ 公 布 相 应 的 电力 实时 调度 : 将 调度 情况 提供 给 客户 主体 ; @ 接 受 最 后 的 调 
度 实现 信息 : 发 送 实际 的 仪表 数据 。 

供 方 顾客 
拍卖 开始 














图 6-26 ”Homebots 系统 中 的 对 话 图 : 电力 拍卖 中 的 任务 及 其 通信 和 链接 


这 用 于 营业 量 以 及 进一步 负载 管理 操作 的 评估 。 

为 了 计算 简单 ,我 们 给 出 了 一 个 尽 可 能 简单 的 任务 分 配 和 Agent 结构 的 例子 。 例 
如 ,将 供 方 Agent( 代 表 能 源 企 业 的 利益 ) 与 负责 拍卖 的 Agent 分 离开 可 能 更 好 。 
在 一 个 规模 较 大 的 应 用 中 ,客户 Agent 将 被 系统 地 组 织 起 来 。 各 任务 的 初始 阶段 
也 会 有 所 不 同 。 在 直接 负载 管理 中 ,拍卖 的 发 起 者 是 供 方 Agent, 而 间接 负载 管理 
中 的 发 起 者 则 是 客户 Agent。 已 调度 的 任务 可 以 以 不 同 的 方式 分 配给 Agent。 此 
时 ,计算 市 场 方法 也 是 十 分 灵活 的 。 图 6-26 也 试图 表达 计算 市 场 方法 的 灵活 性 的 
一 面 。 

在 这 一 基本 场景 中 ,通信 规划 内 部 的 控制 机 制 是 非常 简单 的 。 图 6-27 展示 了 用 状 
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态 图 表示 的 高 层 控制 结构 。 作 为 扩展 ,Agent 的 任务 -事务 对 可 用 “&.” 符 号 表示 
(拍卖 公告 & 开始 拍卖 “投标 & 递交 (标书 )”“ 给 客户 配 电 指标 & 公布 拍卖 结 
果 ”)。 图 6-27 只 表示 了 负载 管理 的 拍卖 部 分 。 因 为 Agent 通信 语言 (如 KQML 
和 FIPA-ACL 的 形式 语义 ) 是 基于 Agent 状态 的 ,所 以 一 般 来 讲 基 于 状态 的 表示 
较为 方便 。 

根据 上 述 背景 ,查阅 资料 ,撰写 论文 ,并 开发 解决 此 类 问题 的 原型 系统 。 


一 一 拍卖 结束 & 
(执行 拍卖 ~ _( 扯 半 入 下 & ) 
[ 茂 少 需求 ?是 ] 一 [ 收 全 2 克 ] [收敛 是 ”后续 的 授予 通信 


/拍卖 公告 & 开 始 拍 卖 让 -- 轮 | 授予 & 提 供 
做? 于] | 表达 喜好 
/退出 


退出 偏好 计算 (策划 ) —® 

[要 电 ? 是 ] | 
/个 标书 & 改 送 标 书 i 
Lo 


图 6-27 Homebots 系统 中 电力 拍卖 过 程 的 通信 规划 控制 (用 UML 状态 图 标记 表示 ) 


























第 / 章 
机 器 学 习 


机 器 学 习 一 直 是 人 工 智能 的 一 个 核心 研究 领域 , 随 着 计算 机 技术 向 智能 
化 .个 性 化 方向 发 展 ,尤其 是 随 着 数据 收集 和 存储 设备 的 飞速 升级 ,科学 技术 
的 各 个 领域 都 积累 了 大 量 的 数据 ,利用 计算 机 对 数据 进行 分 析 , 成 为 几乎 所 
有 领域 的 共性 需求 。2010 年 和 2011 年 分 别 授予 机 器 学 习 领 域 的 两 位 杰出 
学 者 L. Valiant\J. Pearl 图 灵 奖 ,标志 着 机 器 学 习 经 过 多 年 的 莲 孝 发 展 ,已 
成 为 计算 机 科学 中 最 重要 和 最 活跃 的 研究 分 支 之 一 。 

本 章 介绍 机 器 学 习 的 定义 ,意义 和 简 史 ,机 器 学 习 的 主要 策略 和 基本 结 
构 ,详尽 阐述 各 种 机 器 学 习 的 方法 与 技术 ,包括 归纳 学 习 、 决 策 树 学 习 、 解 释 
学 习 、 基 于 反 向 传播 的 学 习 、 竞 争 网 络 .深度 学 习 、 支 持 向 量 机 和 统计 关系 学 
习 等 。 


7.1 机 器 学 习 概述 


学 习 是 一 个 过 程 , 它 允 许 Agent 通过 指令 的 接收 或 经 验 的 积累 对 自身 性 
能 进行 改进 ,被 视 为 智能 行为 的 基础 。 智 能 等 级 不 是 由 技能 定义 的 ,而 是 由 
这 些 物 种 的 学 习 能 力 及 学 习 任 务 的 复杂 性 定义 。 学 习 可 能 只 是 一 个 简单 的 
联想 过 程 ,给 定 特 定 的 输入 ,就 会 产生 特定 的 输出 。 狗 可 以 通过 学 习 将 命令 
“ 坐 " 同 行为 “ 坐 ” 的 身体 反应 联系 起 来 。 联 想 学 习 对 许多 任务 (如 目标 识别 ) 
来 说 都 是 最 基本 的 。 此 外 ,学 习 通 过 与 环境 的 直接 交互 获取 技能 ;“ 设 法 去 做 
(try to do) "方法 就 像 是 学 骑 车 。 人 类 生来 具有 骑 车 的 身体 特征 ,但 却 没 有 
能 够 将 感官 输入 同 所 需 动作 联系 起 来 的 相关 知识 ,通过 这 些 动作 ,人 们 才能 
骑 好 车 。Agent 通过 学 习 获 得 了 知识 ,这 就 是 知识 的 自动 获取 。 对 大 多 数学 
习 来 说 ,都 会 存在 某 种 层次 上 的 先 验 知识 。 先 验 知识 可 能 是 隐 含 的 ,因为 它 
影响 着 对 学 习 算 法 的 选择 以 及 对 输入 的 预 处 理 。 而 有 的 时 候 人 们 又 需要 显 
式 使 用 学 习 中 的 这 些 知 识 , 如 使 用 因果 联系 的 先 验 知识 建造 贝 叶 斯 网 络 , 然 
后 再 应 用 学 习 算法 从 样本 数据 库 中 为 每 个 变量 生成 相应 的 先 验 分 布 。 

学 习 的 成 功 是 多 种 多 样 的 : 学 习 识别 客户 的 购买 模式 ,以 便 能 检测 出 信 
用 卡 欺诈 行为 ;对 客户 进行 扼要 描述 ,以 使 能 对 市 场 推广 活动 进行 定位 ;对 网 
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上 内 容 进行 分 类 并 按 用 户 兴趣 自动 导入 数据 ,为 贷款 申请 人 的 信用 打分 ;对 燃气 涡轮 的 故 
障 进行 诊断 等 。 学 习 也 已 在 诸多 领域 内 得 到 了 印证 ,如 公路 上 的 汽车 导航 、 新 星体 类 别 的 
发 现 ,以 及 学 下 西洋 双 陆 棋 以 达到 世界 冠军 的 水 平 。 


7.1.1 学 习 中 的 元 素 


无 论 是 动物 、 机 器 部 件 , 抑 或 软件 ,任何 学 习 Agent 的 核心 都 只 是 一 个 算法 ,该 算法 
定义 了 用 于 学 习 的 过 程 (指令 集 )。 算 法 用 来 将 输入 数据 转换 成 为 某 种 特定 形式 的 有 用 输 
出 ,这 个 输出 可 以 是 光 扫描 手写 体 的 识别 ,可 以 是 机 器 人 为 抓 住 某 物 体 需 要 执行 的 动作 ， 
可 以 是 棋 类 游戏 中 的 下 一 步 移动 ,也 可 以 是 是 否 允 许 贷款 申请 人 贷款 的 建议 。 通 常 称 学 
习 的 结果 为 目标 函数 。 如 果 学 习 正 确 , 目 标 函数 应 能 接收 输入 数据 并 产生 正确 (最 优 ) 的 
输出 。 例 如 ,目标 函数 可 能 会 接收 一 幅 扫 描 字 符 图 像 , 然 后 输出 {A,B,…,2Z,0,1,…,9}) 中 
对 应 的 一 个 实例 。 这 时 会 有 一 系列 问题 需要 回答 : 目标 函数 如 何 表 示 ? 在 学 习 的 过 程 中 
对 什么 进行 适应 ? 如 何 指导 或 提供 判断 ,使 得 Agent 可 以 知道 学 习 正 沿 着 正确 的 路 线 进 
行 ? 如 何 知 道学 习 将 在 什么 时 候 完成 ? 又 如 何 知道 学 习 已 获 成 功 ? 

假定 存在 一 个 有 关 职 业 骑 手 的 数据 库 , 这 些 职业 骑手 从 事 以 下 运动 项 目 之 一 : 骑马 
越 障碍 表演 、 无 障碍 赛跑 或 耗 时 三 天 的 综合 全 能 马术 比赛 。 该 数据 库 记 录 了 这 样 一 些 属 
性 : 年 龄 .身高 .参加 竞赛 的 年 限 及 体重 。 该 学 习 的 任务 就 是 从 体重 这 一 属性 判断 某 骑 手 
是 否 是 一 名 职业 赛马 骑手 (无 障碍 赛跑 骑手 )。 数 据 库 中 的 每 条 记录 都 标记 有 骑手 的 运动 
项 目 。 学 习 的 第 一 项 任务 就 是 从 中 选取 一 个 训练 数据 集 ,这 些 训练 数据 将 构成 数据 库 的 
一 个 子 集 , 通 常 采用 随机 选取 的 方法 。 在 这 个 例子 中 ,我 们 感 兴趣 的 属性 只 有 体重 和 运动 
项 目 。 体 重 是 一 个 实 值 属性 ,以 千克 为 单位 。 运 动 项 目 是 一 个 文本 标签 ,标记 了 每 位 骑手 
从 事 的 运动 项 目 , 取 值 为 {职业 赛马 骑手 、 骑 马 越 障碍 表演 骑手 ,综合 全 能 马术 比赛 骑手 } 
中 的 一 个 。 目 标 函数 是 一 个 二 值 分 类 器 ,如 果 该 骑手 是 一 名 职业 赛马 骑手 , 则 输出 1, 否 
则 输出 0。 运 动 项 目 还 可 替换 为 一 个 新 属性 , 它 对 所 有 职业 赛马 骑手 都 标记 为 正 , 其 他 类 
型 的 骑手 都 标记 为 负 。 

从 例子 中 进行 学 习 通 常 被 视 为 归纳 推理 。 每 个 例子 都 是 一 个 序 偶 (z, /jz)) ,对 每 一 
个 输入 zx, 都 有 确定 的 输出 /(z)。 学 习 过 程 将 产生 对 目标 函数 了 的 不 同 允 近 , 了 的 每 一 
个 副 近 都 叫 作 一 个 假设 ,假设 需要 以 某 种 形式 加 以 表示 。 在 判断 是 否 为 职业 赛马 骑手 的 
这 个 学 习 任务 中 ,我 们 选择 的 假设 表示 是 一 个 简单 的 阔 值 函数 ,定义 如 下 : 

1f1， zeT 
人 网 zi>T 
其 中 ,zi 是 例子 i 中 属性 体重 的 取 值 ;T 是 一 个 实数 阔 值 。 

通过 调整 假设 表示 ,学 习 过 程 将 产生 出 假设 的 不 同 变形 ,在 表示 中 需要 修改 的 通常 指 
参数 。 这 个 例子 中 只 存在 一 个 参数 了。 训练 集中 的 每 个 例子 都 对 应 一 个 目标 输出 上, 如果 
例子 标记 为 正 , 则 :一 1, 和 否则 :二 0。 每 个 例子 的 实际 输出 w 可 由 公式 y; 二 f(zxi;) 计 算得 
到 ,这 个 实际 输出 可 能 不 同 于 目标 输出 ,在 这 种 情况 下 ,存在 误差 A;。 

可 以 直接 使 用 贝 叶 斯 统计 计算 得 到 阔 值 T。 算 法 对 每 一 个 例子 进行 处 理 ,然后 在 训 
练 数据 上 循环 迭代 ,直到 每 个 例子 的 输出 在 连续 两 次 迭代 中 都 保持 不 变 。 
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学 习 完 成 后 ,测试 数据 集 用 来 审视 学 习 成 功 的 程度 。 设 计 学 习 算 法 的 目的 都 是 要 它 
在 那些 训练 中 未 遇 到 的 数据 上 具有 可 接受 的 性 能 。 在 上 面 的 例子 中 ,通过 学 习 得 到 的 函 
数 应 能 指出 某 个 骑手 是 否 为 职业 赛马 骑手 。 如 果 骑 手 的 运动 项 目 未 知 , 则 该 骑手 的 体重 
就 可 用 来 预测 他 是 否 为 职业 赛马 骑手 。 

以 上 函数 形式 的 局 限 性 在 于 它 的 输出 不 是 0, 就 是 1。 事实 上 ,问题 很 少 像 这 样 具 有 
确定 性 ,一 个 二 值 输出 并 不 能 提供 中 间 的 灰 度 区 域 。 在 0.08 
许多 问题 中 ,拥有 确定 性 度量 是 合理 的 。 提 供 这 种 度量 个 
的 一 种 方法 是 采用 某 个 函数 , 它 的 输出 提供 了 在 给 定 体 时 
重 的 情况 下 骑手 x 是 职业 赛马 骑手 的 一 个 概率 度量 , 即 央 0.04 

区 
去 








(职业 赛马 骑手 | 体重 )。 这 样 , 概 率 分 布 函数 就 可 用 来 

替代 上 述 辣 值 函 数 。 最 常用 的 分 布 是 高 斯 分 布 。 对 单一 

属性 来 说 ,高 斯 函数 由 两 个 参数 决定 , 均值 和 标准 差 。 均 。“。 
值 给 出 的 是 函数 中 心 的 位 置 , 标 准 差 度量 的 是 函数 的 散 体重 

布 范 围 。 图 7-1 给 出 了 一 个 高 斯 函数 。 很 多 密度 估计 技 。 图 7-1 一 维 高 分 布 示例 
术 可 用 来 对 高 斯 函数 的 参数 进行 学 习 。 

在 上 面 的 合子 中 ,目标 函数 表示 的 选择 是 非常 有 限 的 。 如 果 能 利用 更 多 的 可 用 数据 ， 
目标 函数 就 有 可 能 更 准确 地 识别 出 职业 赛马 骑手 。 这 个 例子 中 仅 使 用 了 其 中 的 一 个 属 
性 一 一 体重 。 如 果 训练 例子 可 由 一 个 输入 属性 描述 ,这 就 是 一 维 问题 。 如 果 同 时 还 使 用 
了 另外 一 个 属性 ,如 身高 ,那么 该 问题 就 变 成 二 维 的 了 。 很 多 学 习 类 型 都 试图 将 输入 同 高 
维 空间 中 的 某 个 决策 区 域 关联 起 来 。 在 一 个 二 维 平面 (两 个 输入 ) 上 ,决策 区 域 可 由 多 条 
直线 定义 。 假 设 表示 决定 了 这 些 区 域 的 形状 。 例 如 ,在 二 维 空间 中 ,高 斯 函数 就 变 成 了 名 
形 。 许 多 学 习 问题 都 使 用 了 多 个 属性 ,因此 被 视 作 高 维 问题 。 应 小 心 选取 属性 的 个 数 ,这 
是 因为 增加 太 多 属性 会 导致 分 类 性 能 的 退化 ,这 就 是 维 数 灾难 ,与 期 望 的 正好 相反 。 对 于 
相对 少量 的 训练 例子 ,如 果 使 用 了 太 多 属性 ,就 会 使 高 维 空间 变 得 非常 稀 玖 ,这 意味 着 训 
练 例子 过 于 分 散 , 带 来 的 危险 是 本 属于 同一 类 的 训练 例子 被 分 割 到 不 同 的 区 域 。 另 外 要 
注意 ,学 到 的 假设 可 能 会 是 目标 函数 的 一 个 不 好 的 表示 ,此 时 对 新 数据 的 分 类 精度 将 会 
很 差 。 


7.1.2 目标 函数 的 表示 


学 习 算法 可 以 按照 不 同方 式 进行 分 组 : 可 以 分 为 有 监督 和 无 监督 两 种 ;或 者 按照 学 
习 任务 的 类 型 进行 分 组 ,如 概念 学 习 或 回归 学 习 ; 还 可 按照 应 用 领域 进行 分 组 。 此 外 ,还 
可 按照 目标 函数 的 表示 方法 对 学 习 进 行 分 组 。 图 7-2 给 出 了 3 种 不 同 的 假设 (目标 函数 ) 
表示 方法 。 第 一 种 表示 方法 使 用 了 一 棵 树 , 根 结 点 表示 属性 ,分 支 表 示 属 性 值 。 树 可 用 来 
表示 分 类 函数 \ 决 策 函 数 , 甚 至 还 可 用 来 表示 程序 。 第 二 种 表示 方法 使 用 了 一 阶 逻 辑 。 为 
了 对 一 组 点 进行 分 类 ,第 三 种 表示 方法 使 用 两 条 直线 组 成 了 一 个 决策 区 域 。 还 有 其 他 的 
假设 表示 方法 ,其 中 包括 图 和 二 进 制 串 。 不 同 的 表示 方法 不 一 定 相互 排斥 ,因为 一 种 表示 
方法 可 以 从 不 同 的 角度 进行 观察 。 用 来 分 类 的 树 实际 上 也 相应 地 定义 了 高 维 空间 中 的 一 
组 决策 区 域 。 因 此 ,使 用 不 同 表示 方法 的 算法 相互 之 间 可 以 进行 比较 ,有 时 还 能 发 现在 给 
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定 相同 任务 的 情况 下 这 些 算法 有 相似 的 性 能 。 影 响 表 示 选 择 的 因素 很 多 ,如 属性 类 型 ( 连 
续 /离散 ) ,执行 学 到 的 任何 函数 必需 的 速度 ,学 习 过 程 是 否 为 整个 系统 的 一 部 分 ,以 及 特 
学 习 算法 将 会 有 更 好 性 能 的 信念 等 。 某 些 算法 指定 工作 于 连续 值 属性 ,而 其 他 一 些 算 
法 则 指定 工作 于 离散 值 属性 ,还 有 一 些 算法 能 够 工作 在 连续 值 和 离散 值 属性 混合 的 情况 
下 。 假 设 应 如 何 表示 ? 只 有 对 特定 应 用 领域 及 不 同学 习 算法 有 了 较 好 的 理解 之 后 ,才能 
决定 。 
经 常 影响 假设 表示 选择 的 另外 一 个 因素 是 已 学 知识 的 可 见 性 。 许 多 表示 形式 (如 分 
类 树 和 一 阶 迎 辑 ) 都 能 够 对 知识 进行 显 式 表示 。 通 过 显 式 表 示 ,就 可 能 对 如 何 产生 这 个 决 
策 进行 解释 。 某 些 假 设 更 像 一 个 黑匣子 。 例 如 ,通过 神经 网 络 学 习 得 到 的 知识 是 由 该 网 
络 的 权 值 表示 的 ,这 样 几乎 不 能 表达 什么 直观 上 的 信息 ,因此 称 之 为 黑匣子 。 尽 管 正在 进 
行 的 很 多 研究 都 试图 理解 神经 网 络 的 表示 ,并 开发 出 了 一 些 技术 用 来 将 已 学 到 的 知识 转 
换 为 某 种 更 加 可 读 的 表示 形式 。 但 是 ,很 多 学 习 问 题 难 以 解释 获得 的 知识 ,目前 还 不 得 不 
接受 这 个 事实 。 具 有 争议 的 是 ,对 任何 学 习 Agent 获得 的 知识 进行 洞察 应 该 是 更 可 取 
的 ,但 神经 网 络 等 这 类 学 习 机 器 的 确 被 证 明 是 非常 适合 于 现实 世界 问题 的 。 
在 学 习 过 程 中 会 产生 不 同 的 候选 假设 。 图 7-2 给 出 了 3 种 目标 函数 表示 方法 。 在 学 
习 过 程 中 会 产生 不 同 的 树 ,每 一 棵 树 都 表示 了 一 个 不 同 的 分 类 函数 (图 7-2(a))。 通 过 增 





加 和 删除 文字 可 以 对 一 阶 逻 辑 表达 式 进 行 修改 (图 7-2(b))。 对 于 显示 的 第 三 种 表示 方 
法 (图 7-2(c)), 可 通过 重 画 已 有 直线 或 增加 额外 直线 对 其 中 的 直线 进行 修改 ,这 样 可 产生 
腿 数 





PE 0 该 假设 表示 为 一 棵 分 类 树 。 属 性 由 根 结 点 表示 ， 
加 属 人 的 不 同 取信 由 相应 分 去 表示 (例如 ， 在 根 结 














时 人 正信 各 关 叶 持 结 计 家 宁 大 多 阔 约定 了 的 上 
标 值 同 目标 分 类 相 开 配 ， 答 标记 为 负 的 那些 叶 
噬 放生 子 结 点 则 表示 大 多 数 给 定 例子 的 目标 值 同 目标 
分 类 不 匹配 。 从 最 上 层 的 根 结 点 开始 ， 然 后 沿 
NA 有 有/ 着 癌 对 应 帮 作 信 相机 的 分 到 直 疝 下) 直到 
某 个 叶子 结 点 为 止 ， 访 例子 就 相应 地 指派 给 
正 负 正 负 个 叶子 结 点 
人 @) 分 类 图 表示 





鳞 ( 鱼 )， 腿 数 ( 鱼 ，0)， 排卵 ( 鱼 )， 栖 息 地 
( 鱼 ， 水 )， 该 假设 表示 为 文字 的 合 取 。 














(b) 谓词 表示 


六 全 放 家 二 元 让 从 的 全国 和 由 两 条 直线 组 成 。 
为 了 其 他 数据 点 分 离开 ， 要 求 
2 大 月 二 从 下 尖 藉 的 和 条 












(c) 二 维 平面 表示 
图 7-2 目标 函数 表示 方法 的 3 个 例子 
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不 同 的 候选 假设 。 学 习 过 程 可 被 视 为 在 候选 假设 空间 上 的 一 个 搜索 ,搜索 的 目的 是 寻找 
最 能 表示 目标 函数 的 那个 假设 。 


7.1.3 学 习 任 务 的 类 型 


应 用 机 器 学 习 的 领域 很 多 ,下 面 仅 列举 了 其 中 的 某 一 些 学 习 任 务 类 型 。 

1. 分 类 学 习 

很 多 应 用 都 可 归 类 于 分 类 学 习 的 范畴 , 光 扫描 和 自动 识别 手写 字符 就 是 这 样 一 种 应 
用 ,该 应 用 要 求 机 器 能 够 扫描 字符 图 像 并 输出 对 应 的 类 别 。 若 语言 为 英语 , 则 机 器 需要 学 
习 的 只 是 对 数字 0 一 9 以 及 字符 A 一 Z 的 分 类 。 这 个 学 习 过 程 是 有 监督 的 ,因为 每 个 训练 
例子 的 类 标 都 是 已 知 的 。 当 然 , 无 监督 学 习 也 广泛 地 用 在 分 类 任务 中 ,即便 目标 分 类 对 任 
一 训练 例子 来 说 都 是 已 知 的 ,采用 无 监督 技术 有 时 也 非常 有 用 ,因为 这 样 可 以 审视 这 些 训 
练 例子 是 如 何 按照 不 同属 性 进行 分 组 的 。 无 监督 学 习 还 广泛 地 用 在 没有 可 用 目标 分 类 的 
情况 下 ,这 时 的 学 习 任 务 就 是 在 训练 例子 中 搜寻 那些 较为 相似 的 模式 。 这 样 的 典型 应 用 
是 对 传感器 获得 的 数据 进行 异常 检测 ,传感器 固定 在 机 器 (如 直升机 变速 器 ) 上 ,这 样 可 及 
时 检测 出 对 应 机 器 的 故障 ,以 免 导致 更 大 的 错误 。 

2. 动作 序列 学 习 

对 棋 类 游戏 以 及 那些 周游 于 办 公 室 附近 用 来 清空 垃圾 箱 的 机 器 人 来 说 ,都 需要 情景 
估计 和 动作 选择 。 用 来 下 棋 的 Agent 必须 读 懂 棋 盘 的 当前 状态 ,并 决定 将 要 采取 的 下 一 
步 动作 : 移动 某 个 棋子 ,依据 是 它 相 信 这 个 动作 将 会 使 获胜 的 可 能 性 最 大 。 同 理 , 机 器 人 
决定 采取 的 下 一 步 动作 将 会 使 垃圾 收集 的 效率 最 大 ,同时 确保 在 到 达 再 次 充电 地 点 之 前 
不 会 搁浅 。 

机 器 学 习 有 可 能 让 人 工 智 能 角色 积累 经 验 , 改 进 自己 的 技能 并 适应 不 同 的 玩家 。 归 
纳 学 习 和 增强 学 习 是 游戏 环境 最 受 关注 的 两 种 机 器 学 习 方法 。 狮 头 公 司 的 战略 游戏 “ 黑 
与 白 ” 及 其 续集 采用 了 将 两 者 组 合 的 技术 。 

在 “ 黑 与 白 ? 游 戏 中 ,每 个 玩家 分 到 一 个 宠物 ,作为 在 人 工 智能 控制 下 的 支持 者 。 玩 家 
可 以 教导 宠物 ,通过 抚摸 鼓励 正确 的 行为 ,通过 拍打 惩罚 错误 的 行为 。 归 纳 学 习 和 增强 学 
习 的 组 合 使 用 可 使 宠物 对 个 别 行动 的 肯定 或 者 批评 应 答 进行 总 结 , 形 成 一 般 性 的 应 该 和 
不 应 该 采取 哪些 行动 的 指导 规则 。 

另 一 个 游戏 中 应 用 机 器 学 习 的 例子 是 Drivatar 技术 。 该 技术 是 微软 的 赛车 游戏 “ 极 
限 竞 速 ” 的 显著 特色 ,可 以 让 玩家 按照 自己 的 驾驶 方式 训练 智能 控制 的 车 手 。 按 照 一 位 游 
戏 开 发 人 员 的 说 法 ,机 器 学 习 可 以 成 为 "可怕 的 魔法 师 ”, 使 游戏 的 智能 具备 了 超越 程序 预 
先 设 定 行为 的 潜能 。 

3. 最 优 决策 学 习 

学 习 过 程 还 包括 了 对 贝 叶 斯 网 络 和 决策 网 络 结构 的 自动 创建 ,以 及 随 着 经 验 的 积累 
不 断 对 其 分 布 进行 调整 。 另 外 ,决策 过 程 还 可 能 表达 为 一 棵 决策 树 。 学 习 的 这 些 形式 当 
然 也 包括 可 能 会 串 行 执行 甚至 会 并 行 执行 的 动作 。 学 到 的 决策 过 程 在 期 望 奖励 与 期 望 惩 
罚 之 比 最 大 化 这 个 意义 下 一 定 是 最 优 的 。 例 如 ,对 是 否 要 发 射 航天 器 进行 决策 一 定 要 在 
按时 发 射 和 失败 风险 之 间 进 行 权衡 ,这 种 风险 是 由 外 部 因素 (如 天 气 条 件 ) 引 起 的 。 
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4. 回归 函数 学 习 

回归 学 习 指 的 是 学 习 一 个 变量 ( 因 变 量 ) 与 其 他 变量 ( 自 变量 ) 间 的 某 种 相关 性 。 这 样 
的 典型 应 用 包括 对 正常 记录 的 某 些 缺失 信号 进行 插值 ,造成 这 种 问题 的 原因 可 能 是 传 感 
器 故障 。 例 如 , 某 喷气 式 发 动机 有 两 个 轴 : 一 个 轴 连 接 低速 压缩 机 ; 另 一 个 轴 连 接 高 速 压 
缩 机 。 这 两 个 轴 在 机 械 上 是 相互 独立 的 ,但 它们 旋转 的 速度 却 是 相关 的 。 旋 转速 度 用 来 
计算 性 能 ,这 是 飞机 发 动机 的 一 个 关键 度量 。 传 感 器 故障 可 导致 其 中 一 个 轴 的 某 信 号 缺 
失 , 这 样 就 有 可 能 通过 其 他 发 动机 控制 参数 对 该 缺失 信号 进行 插值 ,这 些 控制 参数 中 就 包 
括 另外 一 个 轴 的 旋转 速度 。 回 归 函 数学 习 的 另 一 个 例子 是 对 股票 指数 的 未 来 值 进行 
预测 。 

5. 程序 学 习 

所 有 学 习 形 式 都 可 视 做 一 种 自动 程序 设计 。 然 而 ,也 存在 另外 一 些 学 习 算 法 ,它们 的 
特定 目的 就 是 用 来 学 习 表 示 任 务 的 解决 方案 ,表示 的 语法 很 像 一 种 编程 语言 。 例 如 ,存在 
某 些 学 习 算 法 ,它们 的 目标 函数 就 是 一 段 Prolog 程序 。 














7.1.4 机 器 学 习 的 定义 和 发 展 史 


学 习 是 人 类 具有 的 一 种 重要 智能 行为 。 学 习 是 系统 在 不 断 重 复 的 工作 中 对 本 身 能 力 
的 增强 或 者 改进 ,使 得 系统 在 下 一 次 执行 同样 任务 或 类 似 任务 时 , 比 现在 做 得 更 好 或 效率 

1959 年 ,Samuel 设计 了 一 个 下 棋 程 序 ,这 个 程序 具有 学 习 能 力 , 它 可 以 在 不 断 地 对 
弈 中 改善 自己 的 棋艺 。4 年 后 ,这 个 程序 战胜 了 设计 者 本 人 。 又 过 了 3 年 ,这 个 程序 战胜 
了 美国 一 个 保持 8 年 之 久 的 常 胜 不 败 的 冠军 。 这 个 程序 向 人 们 展示 了 机 器 学 习 的 能 力 。 

机 器 学 习 是 一 门 研究 机 器 获取 新 知识 和 新 技能 ,并 识别 现 有 知识 的 人 工 智 能 分 支 。 
它 的 发 展 过 程 大 体 上 可 分 为 如 下 4 个 阶段 。 

(1) 20 世纪 50 年 代 中 叶 到 60 年 代 中 叶 , 属 于 热烈 时 期 。 这 个 时 期 研究 的 是 “没有 知 
识 ” 的 学 习 , 即 “无 知 " 学 习 ; 其 研究 目标 是 各 类 自 组 织 系统 和 自 适 应 系统 ;其 主要 研究 方法 
是 不 断 修改 系统 的 控制 参数 ,以 改进 系统 的 执行 能 力 ,不 涉及 与 具体 任务 有 关 的 知识 。 指 
导 本 阶段 研究 的 理论 基础 是 早 在 20 世纪 40 年 代 就 开始 研究 的 神经 网 络 模型 。 这 个 阶段 
的 研究 导致 “模式 识别 ”的 诞生 ,同时 形成 了 两 种 机 器 学 习 方 法 一 一 判别 函数 法 和 进化 学 
习 。Samuel 的 下 棋 程 序 就 是 使 用 判别 函数 法 的 典型 例子 。 

(2) 20 世纪 60 年 代 中 叶 至 70 年代 中 叶 被 称 为 冷静 时 期 。 本 阶段 的 研究 目标 是 模拟 
人 类 的 概念 学 习 过 程 ,并 采用 逮 辑 结构 或 图 结构 作为 机 器 内 部 描述 。 机 器 能 够 采用 符号 
描述 概念 (符号 概念 获取 ) ,并 提出 关于 学 习 概 念 的 各 种 假设 。 本 阶段 的 代表 性 工作 有 
Winston 的 结构 学 习 系 统 和 Hayes Roth 等 人 的 基于 逻辑 的 归纳 学 习 系 统 。 虽 然 这 类 学 
习 系 统 取得 较 大 的 成 功 , 但 只 能 学 习 单一 概念 ,而 且 未 能 投入 实际 应 用 。 此 外 ,神经 网 络 
学 习 机 因 理 论 缺 陷 未 能 达到 预期 效果 而 转 人 低潮 。 

(3) 20 世纪 70 年 代 中 叶 至 80 年 代 中 叶 被 称 为 复兴 时 期 。 在 这 个 时 期 ,人 们 从 学 习 
单个 概念 扩展 到 学 习 多 个 概念 ,探索 不 同 的 学 习 策略 和 各 种 学 习 方 法 。 机 器 的 学 习 过 程 
一 般 都 建立 在 大 规模 的 知识 库 上 ,实现 知识 强化 学 习 。 本 阶段 开始 把 学 习 系 统 与 各 种 应 
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用 结合 起 来 ,促进 了 机 器 学 习 的 发 展 。 在 出 现 第 一 个 专家 学 习 系 统 之 后 ,示例 归 约 学 习 系 
统 成 为 研究 的 主流 ,自动 知识 获取 成 为 机 器 学 习 的 应 用 研究 目标 。1980 年 ,在 美国 的 卡 
内 基 - 梅 隆 大 学 (CCMU) 召 开 了 第 一 届 机 器 学 习 国际 研讨 会 。1984 年 提出 分 类 与 回归 树 
(CART) 方 法 。 此 后 ,机 器 归纳 学 习 进 入 应 用 阶段 。1986 年 ,杂志 《机 器 学 习 》(Machine 
Learning ) 创 刊 。20 世纪 70 年 代 末 ,中 国 科学 院 自动 化 研究 所 进行 质谱 分 析 和 模式 文法 
推断 研究 。 

(4) 机 器 学 习 的 最 新 阶段 始 于 1986 年 。1986 年 提出 反 向 传播 算法 ,1989 年 提出 卷 
积 神经 网 络 。 由 于 神经 网 络 研究 的 重新 兴起 ,机 器 学 习 的 研究 出 现 新 的 高 潮 ,实验 研究 和 
应 用 研究 得 到 重视 。 在 这 一 时 期 ,符号 学 习 由 “无 知 ” 学 习 转 向 有 专门 领域 知识 的 增长 型 
学 习 , 因 而 出 现 了 有 一 定 知识 背景 的 分 析 学 习 。 神 经 网 络 中 的 反 向 传播 算法 获得 应 用 。 
基于 生物 发 育 进 化 论 的 进化 学 习 系 统 和 遗传 算法 因 吸取 了 归纳 学 习 与 连接 机 制 学 习 的 长 
处 而 受到 重视 。 基 于 行为 主义 (actionism) 的 强化 学 习 系 统 因 发 展 新 算法 和 应 用 连接 机 
制 学 习 遗 传 算法 的 新 成 就 而 显示 出 新 的 生命 力 。 数 据 挖掘 研究 的 蓬勃 发 展 为 从 计算 机 数 
据 库 和 计算 机 网 络 ( 含 因特网 ) 提 取 有 用 信息 和 知识 提供 了 新 的 方法 。 

(5) 20 世纪 90 年 代 中 期 到 21 世纪 00 年 代 中 期 是 机 器 学 习 发 展 的 黄金 时 期 ,主要 标 
志 是 学 术 界 涌现 出 一 批 重要 成 果 , 例 如 ,基于 统计 学 习 理 论 的 支持 向 量 机 (1995)、 随 机 森 
林 (2001) 和 AdaBoost 算法 (1997) 等 集成 分 类 方法 ,循环 神经 网 络 (RNN) 和 LSTM 
(1997) , 流 形 学 习 (2000) ,概率 图 模型 ,基于 再 生 核 理论 的 非 线 性 数据 分 析 与 处 理 方法 , 非 
参数 贝 叶 斯 方法 ,基于 正则 化 理论 的 稀 朴 学 习 模型 及 应 用 等 。 这 些 成 果 黄 定 了 统计 学 习 
的 理论 基础 和 框架 。 在 这 一 时 期 ,机 器 学 习 算 法 真正 走向 了 实际 应 用 。 典 型 的 代表 是 车 
牌 识别 .印刷 文字 识别 (OCR) .手写 文字 识别 \、 人 脸 检测 技术 (数码 相机 中 用 于 人 脸 对 
焦 )、 搜 索引 擎 中 的 自然 语言 处 理 技术 和 网 页 排序 .广告 点 击 率 预 估 (CTR)、 推 荐 系统 、 垃 
圾 邮件 过 滤 等 。 

然而 ,机 器 学 习 在 21 世纪 00 年 代 末 也 经 历 了 一 个 短暂 的 徘徊 期 。 

(6) 现在 ,机 器 学 习 已 经 成 为 计算 机 科学 和 人 工 智能 的 主流 学 科 。 这 主要 体现 在 下 
面 3 个 标志 性 的 事件 。 

第 一 ,2010 年 2 月 ,加 州 大 学 伯克利 分 校 教授 乔丹 和 卡 内 基 梅 隆 大 学 教授 米 菊 尔 同 
时 当选 美国 工程 院 院士 ,同年 5 月 份 ,乔丹 教授 又 当选 为 美国 科学 院 院士 。 随 后 几 年 , 概 
率 图 模型 专家 科勒 (Daphne Koller) 当选 为 美国 工程 院 院士 ,理论 计算 机 学 家 和 机 器 学 习 
专家 、Boosting 的 主要 建立 者 之 一 夏 皮尔 (Robert Schapire) 当选 为 美国 工程 院 院士 和 科 
学 院 院士 。 期 间 , 斯 坦 福 大 学 的 统计 学 家 弗 莱 德 曼 和 提 布 施 瓦 尼 (Robert Tibshirani) 、 伯 
克利 分 校 的 华裔 统计 学 家 郁 彬 ,以 及 卡 内 基 梅 隆 大 学 统计 学 家 沃 塞 曼 也 先后 被 选 为 美国 
科学 院 院 士 。 这 是 一 个 非常 有 趣 的 现象 ,因为 这 些 学 者 都 在 机 器 学 习 领 域 做 出 了 非常 重 
要 的 贡献 ,如 弗 莱 德 曼 的 工作 包括 分 类 回归 树 、 多 元 自 适 应 回归 (Multivariate Adaptive 
Regression Splines，MARS) 和 梯度 推进 机 (Gradient Boosting Machines,， GBM) 等 经 典 
机 器 学 习 算法 ,而 提 布 施 瓦 尼 是 最 小 绝对 收缩 和 选择 算 子 (Least Absolute Shrinkage and 
Selection Operator, LASSO) 的 提出 者 。 此 外 ,优化 算法 专家 鲍 德 (Stephen Boyd) 当选 美 
国 工 程 院 院士 .他 和 范 登 贝 格 (Lieven Vandenberghe) 的 合 著 《三 优化 》(Convex 
Optimization) 可 以 说 风靡 机 器 学 习 界 。 今 年 ,机 器 学 习 专 家 、 深 度 学 习 的 领袖 ,多伦多 大 
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学 教授 辛 顿 以 及 该 校 统计 学 习 专 家 瑞 德 (Nancy Reid) 分 别 被 选 为 美国 工程 院 和 科学 院 的 
外 籍 院士 。 在 美国 ,一 个 学 科 能 和 否 被 接纳 为 主流 学 科 的 一 个 重要 标志 是 ,其 代表 科学 家 能 
和 否 被 选 为 院士 。 我 们 知道 米 歇 尔 是 机 器 学 习 早 期 建立 者 之 一 ,而 乔丹 是 统计 机 器 学 习 的 
主要 奠基 者 之 一 。 

第 二 ,2011 年 的 图 灵 奖 授予 了 加 州 大 学 洛杉矶 分 校 教授 珀 尔 (Judea Pearl) ,他 主要 
的 研究 领域 是 概率 图 模型 和 因果 推理 ,这 是 机 器 学 习 的 基础 问题 。 图 灵 奖 通常 颁 给 纯 理 
论 计算 机 学 者 ,或 者 早期 建立 计算 机 架构 或 框架 的 学 者 。 而 把 图 灵 奖 授予 珀 尔 教授 具有 
方向 标的 意义 。 此 外 ,去 年 (科学 ) 和 (自然) 杂志 连 续 发 表 了 4 篇 关于 机 器 学 习 的 综述 论 
文 。 而 且 , 近 几 年 在 这 两 个 杂志 上 发 表 的 计算 机 学 科 论 文 几乎 都 来 自 机 器 学 习 领 域 。 

第 三 ,机 器 学 习 切实 能 被 用 来 帮助 工业 界 解决 问题 。 特 别 是 当下 的 热点 ,如 深度 学 
习 、AlphaGo 无 人 驾驶 汽车 人 工 智能 助理 等 对 工业 界 的 巨大 影响 。 当 今 IT 的 发 展 已 从 
传统 的 微软 模式 转变 到 谷歌 模式 。 传 统 的 微软 模式 可 以 理解 为 制造 业 ,而 谷歌 模式 则 是 
服务 业 。 谷 歌 搜索 完全 是 免费 的 ,服务 社会 ,他 们 的 搜索 做 得 越 来 越 极致 ,同时 创造 的 财 
富 也 越 来 越 丰厚 。 

以 生成 对 抗 网 络 (GAN) 为 代表 的 深度 生成 框架 在 数据 生成 方面 取得 了 惊人 的 效果 ， 
可 以 创造 出 逼真 的 图 像 .流畅 的 文章 动听 的 音乐 ,为 解决 数据 生成 这 种 * 创 作 ” 类 问题 开 
辟 了 一 条 新 思路 。 

深度 学 习作 为 当今 最 有 活力 的 机 器 学 习 方 向 ,在 计算 机 视觉 .自然 语言 理解 .语音 识 
别 、 智 力 游戏 等 领域 的 颠覆 性 成 就 造就 了 一 批 新 兴 的 创业 公司 。 





7.1.5 机 器 学 习 的 主要 策略 


学 习 是 一 项 复杂 的 智能 活动 ,学 习 过 程 与 推理 过 程 是 紧密 相连 的 ,按照 学 习 中 使 用 推 
理 的 多 少 ,机 器 学 习 采 用 的 策略 大 体 上 可 分 为 5 种 一 一 机 械 学 习 、 示 教学 习 、 类 比 学 习 、 示 
例 学 习 和 集成 学 习 。 学 习 中 所 用 的 推理 越 多 ,系统 的 能 力 就 越 强 。 

机 械 学 习 就 是 记忆 ,是 最 简单 的 学 习 策 略 。 这 种 学 习 策 略 不 需要 任何 推理 过 程 。 外 
界 输入 知识 的 表示 方式 与 系统 内 部 的 表示 方式 完全 一 致 ,不 需要 任何 处 理 与 转换 。 虽 然 
机 械 学 习 在 方法 上 看 来 很 简单 ,但 由 于 计算 机 的 存储 容量 相当 大 ,检索 速度 又 相当 快 ,而 
且 记 忆 精 确 、 无 丝毫 误差 ,所 以 也 能 产生 人 们 难以 预料 的 效果 。Samuel 的 下 棋 程 序 就 采 
用 了 这 种 机 械 记忆 策略 。 为 了 评价 棋局 的 优 劣 , 它 给 每 一 个 棋局 都 打 了 分 ,对 自己 有 利 的 
棋局 分 数 高 ,对 自己 不 利 的 棋局 分 数 低 , 走 棋 时 尽量 选择 使 自己 分 数 高 的 棋局 。 这 个 程序 
可 记 住 53000 多 个 棋局 及 其 分 值 ,并 能 在 对 弈 中 不 断 地 修改 这 些 分 值 ,以 提高 自己 的 水 
平 ,这 对 于 人 来 说 是 无 论 如 何 也 办 不 到 的 。 

比 机 械 学 习 更 复杂 一 点 的 学 习 是 示 教 学 习 策略 。 对 于 使 用 示 教 学 习 策略 的 系统 来 
说 ,外 界 输入 知识 的 表达 方式 与 内 部 表达 方式 不 完全 一 致 ,系统 在 接受 外 部 知识 时 需要 一 
点 推理 、 翻 译 和 转化 工作 。MYCIN .DENDRAL 等 专家 系统 在 获取 知识 上 都 采用 这 种 学 
习 策 略 。 

类 比 学 习 系统 只 能 得 到 完成 类 似 任务 的 有 关 知 识 , 因 此 ,学习 系 统 必 须 能 够 发 现 当 前 
任务 与 已 知 任务 的 相似 点 ,由 此 制定 出 完成 当前 任务 的 方案 ,因此 , 它 比 上 述 两 种 学 习 策 
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略 需要 更 多 的 推理 。 

采用 示例 学 习 策略 的 计算 机 系统 事先 完全 没有 完成 任务 的 任何 规律 性 的 信息 ,得 到 
的 只 是 一 些 具体 的 工作 例子 及 工作 经 验 。 系 统 需 要 对 这 些 例 子 及 经 验 进 行 分 析 、 总 结 和 
推广 ,得 到 完成 任务 的 一 般 性 规律 ,并 在 进一步 的 工作 中 验证 或 修改 这 些 规律 ,因此 需要 
的 推理 是 几 种 策略 中 最 多 的 。 

集成 学 习 是 指 利用 多 个 同 质 的 学 习 器 对 同一 个 问题 进行 学 习 , 这 里 的 “ 同 质 是 指使 
用 的 学 习 器 属于 同一 种 类 型 ,如 所 有 的 学 习 器 都 是 决策 树 、 都 是 神经 网 络 , 等 等 。 广 义 地 
说 ,只 要 是 使 用 多 个 学 习 器 解决 问题 ,就 是 集成 学 习 。 集 成 学 习 可 以 有 效 地 提高 泛 化 
能 力 。 

此 外 ,还 有 基于 解释 的 学 习 、 强 化 学 习 和 基于 神经 网 络 的 学 习 等 。 


7.1.6 机 器 学 习 系统 的 基本 结构 


学 习 系 统 的 基本 结构 如 图 7-3 所 示 。 环 境 向 系统 的 学 习 部 分 提供 某 些 信息 ,学 习 部 
分 利用 这 些 信息 修改 知识 库 , 以 增进 系统 执行 部 分 完成 任务 的 效能 ,执行 部 分 根据 知识 库 
完成 任务 ,同时 把 获得 的 信息 反馈 给 学 习 部 分 。 在 具体 的 应 用 中 ,环境 、 知 识 库 和 执行 部 
分 决定 了 具体 的 工作 内 容 , 学 习 部 分 需要 解决 的 问题 完全 由 上 述 3 部 分 确定 。 下 面 分 别 
叙述 这 3 部 分 对 设计 学 习 系 统 的 影响 。 
环境 一 | 学 习 =| 知识 库 一 | 执行 

{t 


图 7-3 学 习 系统 的 基本 结构 






































影响 学 习 系 统 设计 的 最 重要 的 因素 是 环境 向 系统 提供 的 信息 。 知 识 库 里 存放 的 是 指 
导 执 行 部 分 动作 的 一 般 原则 ,但 环境 向 学 习 系 统 提供 的 信息 却 是 各 种 各 样 的 。 如 果 信 息 
的 质量 比较 高 ,与 一 般 原则 的 差别 比较 小 , 则 学 习 部 分 就 比较 容易 处 理 。 如 果 向 学 习 系 统 
提供 的 是 杂乱 无 章 的 指导 执行 具体 动作 的 具体 信息 , 则 学 习 系 统 需要 在 获得 足够 数据 之 
后 ,删除 不 必要 的 细节 ,进行 总 结 推广 ,形成 指导 动作 的 一 般 原则 , 放 入 知识 库 。 这 样 ,学 
习 部 分 的 任务 就 比较 繁重 ,设计 起 来 也 较为 困难 。 

因为 学 习 系 统 获得 的 信息 往往 是 不 完全 的 ,所 以 学 习 系 统 进行 的 推理 并 不 完全 是 可 
靠 的 , 它 总 结 出 来 的 规则 可 能 正确 ,也 可 能 不 正确 ,这 要 通过 执行 效果 加 以 检验 。 正 确 的 
规则 能 使 系统 的 效能 提高 ,应 予 保留 ;不 正确 的 规则 应 予 修 改 或 从 数据 库 中 删除 。 

知识 库 是 影响 学 习 系 统 设计 的 第 二 个 因素 。 知 识 的 表示 有 多 种 形式 ,如 特征 向 量 一 
阶 逻 辑 语句 、 产 生 式 规则 、 语 义 网 络 和 框架 等 。 这 些 表示 方式 各 有 其 特点 ,在 选择 表示 方 
式 时 要 兼顾 以 下 4 个 方面 。 

(1) 表达 能 力 强 。 例 如 ,如 果 研 究 的 是 一 些 孤立 的 木 块 , 则 可 选用 特征 向 量 表 示 方 
式 。 用 (< 颜色 二 ,一 形状 二 ,二 体积 二 ) 形 式 的 向 量 表示 木 块 。 用 一 阶 迎 辑 公式 描述 木 块 
之 间 的 相互 关系 ,如 用 公式 3z 3y(RED(zx) 人 GREEN(y) 人 ONTOP(z,y)) 表 示 一 个 红 
色 的 木 块 在 一 个 绿色 的 木 块 上 面 。 

(2) 易于 推理 。 例 如 ,在 推理 过 程 中 经 常会 遇 到 判别 两 种 表示 方式 是 否 等 价 的 问题 。 
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在 特征 向 量 表示 方式 中 ,解决 这 个 问题 比较 容易 ;在 一 阶 逻 辑 表示 方式 中 ,解决 这 个 问题 
要 花费 较 高 的 计算 代价 。 因 为 学 习 系 统 通 常 要 在 大 量 的 描述 中 查找 ,很 高 的 计算 代价 会 
严重 影响 查找 的 范围 。 因 此 ,如 果 只 研究 孤立 的 木 块 而 不 考虑 相互 的 位 置 , 则 应 该 使 用 特 
征 向 量 表示 。 

(3) 容易 修改 知识 库 。 学 习 系 统 的 本 质 要 求 它 不 断 地 修改 自己 的 知识 库 , 当 推广 得 
出 一 般 执 行规 则 后 ,要 加 到 知识 库 中 去 。 当 发 现 某 些 规则 不 适用 时 ,要 将 其 删除 。 因 此 ， 
学 习 系 统 的 知识 表示 一 般 都 采用 明确 、 统 一 的 方式 ,如 特征 向 量 、 产 生 式 规 则 等 ,以 利于 知 
识 库 的 修改 。 新 增加 的 知识 可 能 与 知识 库 中 原 有 的 知识 相 矛 盾 , 因 此 有 必要 对 整个 知识 
库 作 全 面 调整 。 删 除 某 一 知识 也 可 能 使 许多 其 他 知识 失效 ,因此 需要 进一步 作 全 面 检查 。 

(4) 知识 表示 易于 扩展 。 随 着 系统 学 习 能 力 的 提高 ,单一 的 知识 表示 已 经 不 能 满足 
需要 ;一 个 系统 可 能 同时 使 用 几 种 知识 表示 方式 。 有 时 还 要 求 系统 自己 能 够 构造 出 新 的 
表示 方式 ,以 适应 外 界 信息 不 断 变化 的 需要 。 因 此 ,要 求 系统 包含 如 何 构造 表示 方式 的 元 
级 描述 。 现 在 ,人 们 把 这 种 元 级 知识 也 看 成 是 知识 库 的 一 部 分 。 这 种 元 级 知识 使 学 习 系 
统 的 能 力 得 到 极 大 提高 ,使 其 能 够 学 会 更 加 复杂 的 东西 ,不 断 地 扩大 它 的 知识 领域 和 执行 
能 力 。 

学 习 系 统 不 能 在 全 然 没 有 任何 知识 的 情况 下 凭空 获取 知识 ,每 一 个 学 习 系统 都 要 求 
具有 某 些 知识 ,以 理解 环境 提供 的 信息 ,分 析 比 较 , 做 出 假设 ,检验 并 修改 这 些 假设 。 因 
此 ,学 习 系统 是 对 现 有 知识 的 扩展 和 改进 。 


7.2 基于 符号 的 机 器 学 习 


基于 符号 的 学 习 算 法 可 以 从 几 个 维度 进行 表征 。 中 学习 任 务 的 数据 和 目标 。 我 们 表 
征 学 习 算 法 的 一 个 主要 方式 就 是 看 学 习 器 的 目标 和 给 定 的 数据 。 例 如 ,概念 学 习 算 法 , 初 
始 状态 是 目标 类 的 一 组 正 例 (通常 也 有 反例 ) ,学习 的 目标 是 得 出 一 个 通用 的 定义 , 它 能 够 
让 学 习 器 辨识 该 类 的 未 来 的 实例 。 基 于 解释 的 学 习 试 图 从 单一 的 训练 实例 和 预先 给 定 的 
特定 领域 的 知识 库 中 推出 一 个 泛 化 的 概念 。 概 念 聚 类 算法 阐释 了 归纳 问题 的 另外 一 种 情 
况 : 这 些 算法 的 初始 状态 是 未 分 类 的 实例 集合 ,而 不 是 从 已 经 分 好 类 的 实例 集合 进行 学 
习 。 回 所 学 知识 的 表示 。 机 器 学 习 程序 利用 本 书 讨论 的 所 有 知识 表示 语言 。 四 操作 的 集 
合 。 给 定 训练 实例 集 ,学 习 器 必须 建立 满足 目标 的 泛 化 .启发 式 规则 或 者 计划 。 这 就 需要 
对 表示 进行 操作 的 能 力 。@ 概 念 空间 。 表 示 语 言 和 操作 定义 了 潜在 概念 定义 的 空间 。 学 
习 器 必须 搜索 这 个 空间 寻找 所 期 望 的 概念 。 概 念 空间 的 复杂 度 是 学 习 问 题 难度 的 主要 度 
量 。@ 启 发 式 搜索 。 学 习 器 必须 给 出 搜索 的 方向 和 顺序 ,并 且 要 利用 可 用 的 训练 数据 和 
启发 式 信息 有 效 地 搜索 。 

下 面 逐 一 讨论 几 种 比较 常用 的 学 习 方法 。 


7.2.1 归纳 学 习 


归纳 (induction) 是 一 种 从 个 别 到 一 般 ` 从 部 分 到 整体 的 推理 行为 。 归 纳 推理 是 从 足 
够 多 的 具体 事例 中 归纳 出 一 般 性 知识 ,提取 事物 的 一 般 规 律 , 从 个 别 到 一 般 的 推理 。 在 进 
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行 归纳 时 ,一 般 不 可 能 考察 全 部 相关 事例 ,因而 归纳 出 的 结论 无 法 保证 其 绝对 正确 ,但 又 
能 以 某 种 程度 相信 它 为 真 。 这 是 归纳 推理 的 一 个 重要 特征 。 例 如 ,由 “ 麻 淮 会 飞 “ 镶 子 会 
飞 ”“ 匣 子 会 飞 " 等 已 知事 实 ,可 能 归纳 出 “有 翅膀 的 动物 会 飞 ”"" 长 羽毛 的 动物 会 飞 "等 结 
论 。 这 些 结论 一 般 情况 下 都 是 正确 的 ,但 当 发 现 驶 乌有 羽毛 有 翅膀 ,可 是 不 会 飞 时 ,就 动 
摇 了 上 面 归纳 出 的 结论 。 这 说 明 上 面 归纳 出 的 结论 不 是 绝对 为 真 的 ,只 能 从 某 种 程度 相 
信 它 为 真 。 

归纳 学 习 (induction learning) 是 应 用 归纳 推理 进行 学 习 的 一 种 方法 。 根 据 归纳 学 习 
有 无 教师 指导 ,可 把 它 分 为 示例 学 习 和 观察 与 发 现 学 习 。 前 者 属于 有 师 学 习 ,后 者 属于 无 
师 学 习 。 

1. 归纳 学 习 的 模式 和 规则 

除了 数学 归纳 外 ,一 般 的 归纳 推理 结论 只 是 保 假 的 , 即 归 纳 依据 的 前 提 错 误 ,那么 结 
论 也 错误 ,但 前 提 正 确 时 结论 也 不 一 定 正确 。 从 相同 的 实例 集合 中 可 以 提出 不 同 的 理论 
解释 它 ,应 按 某 一 标准 选取 最 好 的 作为 学 习 结 果 。 

人 类 知识 的 增长 主要 得 益 于 归纳 学 习 方 法 。 虽然 归 纳 得 出 的 新 知识 不 像 演绎 推理 结 
论 那 样 可 靠 ,但 存在 很 强 的 可 证 伪 性 ,对 认识 的 发 展 和 完善 具有 重要 的 启发 意义 。 

1) 归纳 学 习 的 模式 

归纳 学 习 的 一 般 模式 为 

给 定 : 观察 陈述 (事实 )F, 用 以 表示 有 关 某 些 对 象 .状态 ,过程 等 的 特定 知识 ; 四 候 
定 的 初始 归纳 断言 (可 能 为 空 ); @ 背 景 知识 ,用 于 定义 有 关 观 察 陈述 ,候选 归纳 断言 以 及 
任何 相关 问题 领域 知识 、 假 设 和 约束 ,其 中 包括 能 够 刻画 所 求 归纳 断言 的 性 质 的 优先 
准则 。 

求 : 归纳 断言 (假设 ) 刀 ,能 重 言 蔓 涵 或 弱 蕴涵 观 察 陈述 ,并 满足 背景 知识 。 

假设 互 永 真 草 涵 事实 下 ,说 明正 是 互 的 逻辑 推论 , 则 有 

HH | >F ( 读 作 刀 特 殊 化 为 F) 或 F | 二 HH ( 读 作 下 一 般 化 为 HH) 

这 里 ,从 万 推导 到 下 是 演绎 推理 ,因此 是 保 真 的 ;而 从 事实 下 推导 出 假设 要 是 归纳 
推理 ,因此 不 是 保 真 的 ,而 是 保 假 的 。 

归纳 学 习 系 统 的 模型 如 图 7-4 所 示 。 实 验 规划 过 程 通过 对 实例 空间 的 搜索 完成 实例 
选择 ,并 将 这 些 选中 的 活跃 实例 提交 给 解释 过 程 。 


























解释 过 程 
解释 过 程 对 实例 加 以 适当 转换 ,把 活跃 实例 变换 为 
规则 空间 中 的 特定 概念 ,以 引导 规则 空间 的 搜索 。 2 全 规则 空间 
2) 归纳 概括 规则 规划 过 程 





在 归纳 推理 过 程 中 ,需要 引用 一 些 归纳 规则 。 图 7-4 归纳 学 习 系统 的 模型 

这 些 规则 分 为 选择 性 概括 规则 和 构造 性 概括 规则 两 

类 。 令 Di 、D; 分 别 为 归纳 前 后 的 知识 描述 , 则 归纳 是 Di 全 D: 。 如 果 D; 中 的 所 有 描述 基 
本 单元 (如 谓词 子 句 的 谓词 ) 都 是 D, 中 的 ,只 是 对 Di 中 基本 单元 有 所 取舍 ,或 改变 连接 
关系 ,那么 就 是 选择 性 概括 。 如 果 D, 中 有 新 的 描述 基本 单元 (如 反映 Di 各 单元 间 的 某 
种 关系 的 新 单元 ) ,那么 就 称 之 为 构造 性 概括 。 这 两 种 概括 规则 的 主要 区 别 在 于 ,后 者 能 
够 构造 新 的 描述 符 或 属性 。 设 CTX ,CTX, 和 CTX 表示 任意 描述 ,K 表示 结论 , 则 有 如 
下 几 条 常用 的 选择 性 概括 规则 。 
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QO 取消 部 分 条 件 。 
CTX A S 一 KK 一 CTX 一 开 
其 中 ,S 是 对 事例 的 一 种 限制 ,这 种 限制 可 能 是 不 必要 的 ,只 是 联系 着 具体 事物 的 某 些 无 
关 特 性 ,因此 可 以 去 除 。 例 如 ,在 医疗 诊断 中 ,在 检查 病人 身体 时 ,病人 的 衣着 与 问题 无 
关 , 因 此 要 从 对 病人 的 描述 中 去 掉 对 衣着 的 描述 。 这 是 常用 的 归纳 规则 。 这 里 ,把 = 理解 
为 “等 价 于 ”。 
@ 放松 条 件 。 
CTX, — K>(CTX1 V CTX,)—K 
一 个 事例 的 原因 可 能 不 止 一 个 , 当 出 现 新 的 原因 时 ,应 该 把 新 原因 包含 进去 。 这 条 规则 的 
一 种 特殊 用 法 是 扩展 CTX 的 取 值 范围 ,如 将 一 个 描述 单元 项 0<4<20 扩展 为 0 入 :和 30。 
@ 沿 概念 树 上 漳 。 
CTX A[L=a]—>K 
CTX A[L=6]—K 





>CTX A[L= SJ]>K 


CTX A[L=i>K 
其 中 ,L 是 一 种 结构 性 的 描述 项 ,S 代表 所 有 条 件 中 的 工 值 在 概念 分 层 树 上 最 近 的 共同 祖 
先 。 这 是 一 种 从 个 别 推论 总 体 的 方法 。 
例如 ,人 很 聪明 ,猴子 比较 聪明 ,猩猩 也 比较 聪明 ,人 、 猴 子 猩猩 都 属于 动物 分 类 中 的 
灵长目 。 因 此 ,利用 这 种 归纳 方法 可 以 推出 结论 : 灵长目 的 动物 都 很 聪明 。 
@ 形成 闭合 区 域 。 
CTX A[L=a]j—>K 
全 何 冯 直 >CTX A[L= S]—K 
其 中 ,L 是 一 个 具有 线性 关系 的 描述 项 ,a 是 它 的 特殊 值 。 这 条 规则 实际 上 是 一 种 选取 
极端 情形 ,再 根据 极端 情形 下 的 特性 进行 归纳 的 方法 。 
例如 ,温度 为 8C 时 ,水 不 结 冰 , 处 于 液态 ;温度 为 80C 时 ,水 也 不 结 冰 , 处 于 液态 。 由 
此 可 以 推出 : 温度 在 8 一 80C 时 ,水 都 不 结 冰 ,都 处 于 液态 。 
G 将 常量 转化 成 变量 。 
F(A,Z) A F(B,Z) A MN F(I,Z)—> KF(asz) 人 FGOz) 人 … 人 FFGiz) 一 开 
式 中 ,2Z,A,B,…,I 是 常量 ,z,a,b,… ,i 是 变量 。 
这 条 规则 是 只 从 事例 中 提取 各 个 描述 项 之 间 的 某 种 相互 关系 ,而 忽略 其 他 关系 信息 
的 方法 。 这 种 关系 在 规则 中 表现 为 一 种 同一 关系 , 即 F(A,Z) 中 的 Z 与 F(B,2Z) 中 的 Z 
是 同一 事物 。 
2. 归纳 学 习 方 法 
1) 示例 学 习 
示例 学 习 (learning from examples) 又 称 为 实例 学 习 , 它 是 通过 环境 中 若干 与 某 概念 
有 关 的 例子 ,经 归纳 得 出 一 般 性 概念 的 一 种 学 习 方 法 。 在 这 种 学 习 方 法 中 ,外 部 环境 ( 教 
师 ) 提 供 的 是 一 组 例子 ( 正 例 和 反例 ) ,它们 是 一 组 特殊 的 知识 ,每 一 个 例子 表达 了 仅 适 用 
于 该 例子 的 知识 。 示 例 学 习 就 是 要 从 这 些 特殊 知识 中 归纳 出 适用 于 更 大 范围 的 一 般 性 知 
识 ,以 覆盖 所 有 的 正 例 并 排除 所 有 有 反例。 例如 ,如 果 用 一 批 动物 作为 示例 ,并 且 告 诉 学 习 
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系统 哪 一 个 动物 是 “ 马 ”, 哪 一 个 动物 不 是 。 当 示例 足够 多 时 ,学 习 系 统 就 能 概括 出 关于 
“ 马 ” 的 概念 模型 ,使 自己 能 够 识别 马 ,并 且 能 将 马 与 其 他 动物 区 别 开 。 

例 7.1 表 7-1 给 出 肺炎 与 肺结核 两 种 病 的 部 分 病例 。 每 个 病例 都 含有 5 种 症状 : 
发 烧 ( 无 、 低 、 中 、 高 ) ,咳嗽 (轻微 ,中 度 、 剧 烈 ),X 光 所 见 阴影 (点 状 、 索 条 状 、 片 状 、 空 洞 )、 
血沉 (正常 、 快 ), 听 诊 ( 正 常 干 鸣 音 ,水 泡 音 )。 

通过 示例 学 习 , 可 以 从 病例 中 归纳 产生 如 下 诊断 规则 。 

(1) 血沉 一 正常 人 (听诊 二 干 鸣 音 V 水 泡 音 ) 一 诊断 一 肺炎 。 

(2) 血沉 王 快 一 诊断 王 肺 结核 。 



































表 7-1 肺病 实例 

项 目 病例 号 人 
发 烧 咳嗽 久光 所 见 阴 影 血沉 听诊 
1 高 剧烈 片 状 正常 水 泡 音 
2 中 度 剧烈 片 状 正常 水 泡 音 
肺炎 | 低 轻微 点 状 正常 干 鸣 音 
4 高 中 度 片 状 正常 水 泡 音 
5 中 度 轻微 片 状 正常 水 泡 音 
1 无 轻微 索 条 状 快 正常 
2 高 剧烈 空洞 快 干 鸣 音 
肺结核 3 低 轻微 索 条 状 快 正常 
4 无 轻微 点 状 快 干 鸣 音 
5 低 中 度 片 状 快 正常 




















决策 树 学 习 是 一 种 重要 的 归纳 学 习 方法 ,内 容 较 系统 ,后 面 用 专门 一 节 详 细 介绍 。 
2) 观察 发 现 学 习 
观察 发 现 学 习 (learning from observation and discovery) 又 称 为 描述 性 概括 ,其 目标 
是 确定 一 个 定律 或 理论 的 一 般 性 描述 ,刻画 观察 集 ,指定 某 类 对 象 的 性 质 。 观 察 发 现 学 习 
可 分 为 概念 聚 类 与 机 器 发 现 两 种 。 前 者 用 于 对 事例 进行 聚 类 ,形成 概念 描述 ;后 者 用 于 发 
现 规律 ,产生 定律 或 规则 。 
(1) 概念 聚 类 。 
概念 聚 类 的 基本 思想 是 把 事例 按照 一 定 的 方式 和 准则 分 组 ,如 划分 为 不 同 的 类 或 不 
同 的 层次 等 ,使 不 同 的 组 代表 不 同 的 概念 ,并 且 对 每 一 个 组 进行 特征 概括 ,得 到 一 个 概念 
的 语义 符号 描述 。 例 如 ,对 如 下 事例 : 
喜 静 麻雀 ,布谷 鸟 .乌鸦 、 鸡 . 鸭 、 鸟 …… 
可 根据 它们 是 否 家 养分 为 如 下 两 类 : 
鸟 二 { 喜 更 , 麻 泡 , 布 谷 鸟 ,乌鸦 ,…… 
家 禽 ={ 鸡 , 胸 , 鹅 ,…… } 
这 里 ,“ 鸟 "和 “家 禽 ” 就 是 由 分 类 得 到 的 新 概念 ,而 且 根 据 相 应 动物 的 特征 还 可 得 知 : 
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“ 鸟 有 羽毛 、 有 翅膀 、 会 飞 、 会 叫 、 时 生 ” 
“家 禽 有 羽毛 .有 翅膀 、 不 会 飞 、 会 叫 、 家 养 ” 
如 果 把 它们 的 共同 特性 抽取 出 来 ,就 可 进一步 形成 “ 鸟 类 ”的 概念 。 
(2) 机 器 发 现 。 
机 器 发 现 是 指 从 观察 事例 或 经 验 数据 中 归纳 出 规律 或 规则 的 学 习 方法 ,也 是 最 困难 
且 最 富 创造 性 的 一 种 学 习 。 它 又 可 分 为 经 验 发 现 与 知识 发 现 两 种 ,前 者 是 指 从 经 验 数据 
中 发 现 规律 和 定律 ,后 者 是 指 从 已 观察 的 事例 中 发 现 新 的 知识 。 


7.2.2 决策 树 学 习 


决策 树 学 习 是 离散 函数 的 一 种 树 形 表示 ,表达 能 力 强 ,可 以 表示 任意 的 离散 函数 ,是 
一 种 重要 的 归纳 学 习 方 法 。 决 策 树 是 能 够 实现 分 治 策略 的 数据 结构 ,可 通过 把 实例 从 根 
结 点 排列 到 某 个 叶子 结 点 对 实例 进行 分 类 ,可 用 于 分 类 和 回归 。 决 策 树 代 表 了 实例 属性 
值 约束 的 合 取 的 析 取 式 , 从 树 根 到 树叶 的 每 一 条 路 径 都 对 应 一 组 属性 约束 的 合 取 , 树 本 身 
对 应 这 些 合 取 的 析 取 。 

1. 决策 树 的 组 成 及 分 类 

决策 树 由 一 些 决策 结 点 和 终端 树叶 组 成 ,每 个 决策 结 点 m 都 实现 一 个 具有 离散 输出 
的 测试 函数 f(z) 标记 分 支 。 给 定 一 个 输入 ,在 每 个 结 点 应 用 一 个 测试 ,并 根据 测试 的 输 
出 确定 一 个 分 支 。 这 一 过 程 从 根 结 点 开始 ,并 递归 地 重复 ,直到 到 达 一 个 叶子 结 点 。 该 叶 
子 结 点 中 的 值 形成 输出 。 

每 个 f(x) 都 定义 了 一 个 4 维 输入 空间 中 的 判别 式 ,将 空间 划分 成 较 小 区 域 ,在 从 根 
结 点 沿 一 条 路 径 向 下 时 ,这 些 较 小 的 区 域 被 进一步 划分 。 每 个 叶子 结 点 都 有 一 个 输出 标 
号 ,对 于 分 类 ,该 标号 是 类 的 代码 ,对 于 回归 , 则 是 一 个 数值 。 一 个 叶子 结 点 定义 了 输入 空 
间 的 一 个 局 部 区 域 , 落 入 该 区 域 的 实例 具有 相同 的 输出 。 依 据 每 个 结 点 测试 的 属性 的 个 
数 ,决策 树 可 分 为 单 变量 树 和 多 变量 树 。 


1) 单 变量 树 
在 单 变量 树 中 ,每 个 结 点 的 测试 值 都 使 用 一 个 输入 维 , 也 就 是 只 测试 一 个 属性 。 如 
图 7-5 所 示 , 单 变量 树 的 椭圆 形 结 点 是 决策 结 点 ,矩形 结 点 是 叶子 结 点 。 决 策 结 点 沿 着 


一 个 轴 划 分 ,后 继 的 决策 结 点 使 用 其 他 属性 进一步 划分 它们 。 第 一 次 划分 之 后 ,{zlzi 去 
wio) 已 是 纯 的 了 ,因此 不 需要 再 划分 。 
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图 7-5 数据 集 与 单 变量 树 
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2) 多 变量 树 

传统 的 单 变量 决策 树 构造 算法 在 一 个 结 点 只 选择 一 个 属性 进行 测试 ,分支 ,忽视 了 信 
息 系统 中 广泛 存在 的 属性 间 的 关联 作用 ,因而 可 能 引起 重复 测试 子 树 的 问题 , 且 某 些 属 性 
可 能 被 多 次 检验 。 因 此 ,出现 了 多 变量 归纳 学 习 系 统 , 即 在 树 的 各 结 点 选择 多 个 属性 的 组 
合 进行 测试 ,一 般 表现 为 通过 数学 或 逻辑 算 子 将 一 些 属性 组 合 起 来 ,形成 新 的 属性 作为 测 
试 属性 ,因而 称 这 样 的 决策 树 为 多 变量 决策 树 。 这 种 方法 可 以 减 小 决策 树 的 规模 ,并 且 对 
解决 属性 间 的 交互 作用 和 重复 子 树 问 题 有 良好 的 效果 ,也 可 能 会 导致 搜索 空间 变 大 ,计算 

杂 性 增加 。 

根据 属性 组 合 的 方式 可 以 将 结 点 分 为 线性 多 变量 结 点 和 非 线性 多 变量 结 点 。 图 7-6 

所 示 的 是 一 个 线性 多 变量 决策 树 。 
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图 7-6 数据 集 与 线性 多 变量 树 


2. 决策 树 的 构造 算法 CLS 

Hunt 于 1966 年 研制 了 一 个 概念 学 习 系统 (Concept Learning System，CLS) ,可 以 
学 习 单个 概念 ,并 能 够 用 学 到 的 概念 分 类 新 的 实例 。 这 是 一 种 早期 的 基于 决策 树 的 归纳 
学 习 系 统 。Quinlan 于 1983 年 对 此 进行 了 扩展 ,提出 了 ID3 算法 。 该 算法 不 仅 能 方便 地 
表示 概念 属性 - 值 信息 的 结构 ,而 且 能 从 大 量 实例 数据 中 有 效 地 生成 相应 的 决策 树 模型 。 
在 CLS 决策 树 中 , 结 点 对 应 于 待 分 类 对 象 的 属性 ,由 某 一 结 点 引出 的 弧 对 应 于 这 一 属性 
可 能 取 的 值 , 叶 结 点 对 应 于 分 类 的 结果 。 

为 构造 CLS 算法 , 现 假 设 如 下 : 给 定 训练 集 TR，TR 的 元 素 由 特征 向 量 及 其 分 类 结 
果 表 示 , 分 类 对 象 的 属性 表 AttrList 为 [A, ,A: ,…',A,], 全 部 分 类 结果 构成 的 集合 为 
Class, 表 示 为 {C1 ,Cs;，,…,C,) ,一 般 2 三 1 和 mm 二 2。 对 每 一 属性 A; ,其 值 域 为 ValueType 
(Ai) , 值 域 可 以 是 离散 的 ,也 可 以 是 连续 的 。 这 样 ,决策 树 TR 的 元 素 就 可 表示 成 二 X， 
C>> 的 形式 ,其 中 X= (a ,as,…,a,),ai 对 应 于 实例 第 i 个 属性 的 取 值 ,CE Class 为 实例 
X 的 分 类 结果 。 

记 V(CX,A,) 为 特征 向 量 X 属性 A, 的 值 , 则 决策 树 的 构造 算法 CLS 可 递归 地 描述 
如 下 。 

算法 7-1 决策 树 构造 算法 CLS。 

(1) 如 果 TR 中 所 有 实例 分 类 结果 均 为 C;, 则 返回 C;。 

(2) 从 属性 表 中 选择 某 一 属性 A; 作为 检测 属性 。 

(3) 不 妨 假设 |ValueType(A;) &, 根 据 A; 取 值 的 不 同 ,将 TR 划分 为 个 训练 集 
TR,，TR: ,…,TR ,其 中 : 

TRi=(<X,C>|<X,C>ETR 且 V(X,A;) 为 属性 A; 的 第 j 个 值 } 
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(4) 从 属性 表 中 去 掉 已 做 检测 的 属性 A, 。 

(5) 对 每 一 个 j}(1 二 ;三 &) ,用 TR; 和 新 的 属性 表 递 归 调 用 CLS, 以 生成 子 分 支 决策 
树 DTR;。 

(6) 返回 以 属性 A; 为 根 ,DTRi ,DTR;,… ,DTR 为 子 树 的 决策 树 。 

现 考虑 鸟 是 否 能 飞 的 实例 , 见 表 7-2。 












































表 7-2 训练 实例 

Instances No. of Wings | Broken Wings | Living Status Area/ Weight Fly 
i 2 0 alive 2.5 和 
2 2 1 alive 2.5 F 
3 2 2 alive 2.6 F 
4 2 0 alive 3.0 过 
5 2 0 dead 3.2 F 
6 0 0 alive 0 F 
7 y 0 alive 0 
8 2 0 alive 3.4 
9 2 0 alive 2.0 F 

在 该 例 中 ,属性 表 为 


AttrList= {No. of Wings,Broken Wings, Living Status,Area/Weight} 
各 属性 的 值 域 为 : 


ValueType (No. of Wings)= {0,1,2} 
ValueType (Broken Wings)= {0,1,2} 
ValueType (Status)= {alive, dead} 
ValueType (Area/Weight)€ 实 数 且 大 于 等 于 0 


系统 分 类 结果 集合 为 Class 二 {TT, F} ,训练 集 共 有 9 个 实例 。 
根据 CLS 构造 算法 , 鸟 飞 的 决策 树 如 图 7-7 所 示 ,每 个 叶子 结 点 表示 乌 是 否 能 飞 的 
描述 。 
从 该 决策 树 可 以 看 出 : 
Fly= (No. of Wings=2) 
人 (Broken Wings=0) 
人 (status=alive) 
人 (Area/Weight>2.5) 


3. 基本 的 决策 树 算法 ID3 

大 多 数 决策 树 学 习 算 法 都 是 核心 算法 的 变 体 ,都 采用 自 顶 向 下 的 贪 禁 搜索 (greedy 
search) 方 法 遍历 可 能 的 决策 树 空 间 ,ID3 就 是 其 中 的 代表 。 基 本 的 决策 树 学 习 算 法 ID3 
是 通过 自 顶 向 下 构造 决策 树 进行 学 习 的 ,构造 过 程 是 从 “ 哪 一 个 属性 将 在 树 的 根 结 点 被 测 
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图 7-7 鸟 飞 的 决策 树 


试 ” 这 个 问题 开始 的 。 为 了 回答 这 个 问题 ,使 用 统计 测试 确定 每 一 个 实例 属性 单独 分 类 训 

练 样 例 的 能 力 ,分 类 能 力 最 好 的 属性 被 选 作 树 的 根 结 点 进行 测试 ,然后 为 根 结 点 属性 的 每 

个 可 能 值 产生 一 个 分 支 , 并 把 训练 样 例 排列 到 适当 的 分 支 之 下 。 然 后 ,重复 整个 过 程 。 
算法 7-2 基本 的 决策 树 学 习 算 法 ID3。 

ID3 (Examples, Target attribute, Attributes) ,其 中 Examples 是 训练 样 例 集 ,Target 
attribute 是 这 棵 树 要 预测 的 目标 属性 ,Attributes 是 除 目 标 属性 外 供 学 习 的 决策 树 要 测 
试 的 属性 列表 。 

(1) 创建 树 的 Root( 根 ) 结 点 。 

(2) 如 果 Examples 都 为 正 ,就 返回 label== 十 的 单 结 点 树 Root。 

(3) 如 果 Examples 都 为 反 ,就 返回 label 二 一 的 单 结 点 树 Root。 

(4) 如 果 Examples 为 空 ,就 返回 单 结 点 树 Root，label 二 Examples 中 最 普遍 的 
Target_attribute 值 。 

(5) 否则 : 

@ A<—Attributes 中 分 类 Examples 能 力 最 好 的 属性 ,一 般 认 为 具有 最 高 信息 增益 
(Information Gain) 的 属性 是 最 好 的 属性 。 

@ Root 的 决策 属性 一 A。 

@ 对 于 A 的 每 个 可 能 值 v;: 

a. 在 Root 下 加 一 个 新 的 分 支 对 应 测试 A 二 vw;。 

b. 令 Examples(vwi) 为 Examples 中 满足 A 属性 值 为 w 的 子 集 。 

c. 如 果 Examples(u ) 为 空 : 在 这 个 新 分 支 下 加 一 个 叶子 结 点 , 结 点 的 label 等 于 
Examples 中 最 普遍 的 Target_attribute 值 ; 否则 在 这 个 新 分 支 下 加 一 个 子 树 ID3 
(Examples(v;), Target_attribute, Attributes— {A})., 

(6) 结束 。 

(7) 返回 Root。 

ID3 算法 是 一 种 自 顶 向 下 增长 树 的 贪 禁 算法 ,在 每 个 结 点 选取 能 最 好 地 分 类 样 例 的 
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属性 。 继 续 这 个 过 程 ,直到 这 棵 树 能 完美 分 类 训练 样 例 , 或 所 有 的 属性 都 已 被 使 用 过 。 
那么 ,在 决策 树 生 成 过 程 中 ,应 该 以 什么 样 的 顺序 选取 实例 的 属性 进行 扩展 呢 ? 可 以 
从 第 一 个 属性 开始 ,然后 依次 取 第 二 个 属性 作为 决策 树 的 下 一 层 扩展 属性 ,如 此 下 去 , 直 
到 某 一 层 所 有 窗口 仅 含 同一 类 实例 为 止 。 但 是 ,一 般 来 说 ,每 一 属性 的 重要 性 是 不 同 的 。 
那么 ,如 何 选择 具有 最 高 信息 增益 ( 即 分 类 能 力 最 好 ) 的 属性 呢 ? 
为 了 评价 属性 的 重要 性 ,Quinlan 根据 检验 每 一 属性 所 得 到 的 信息 量 的 多 少 ,给 出 了 
下 面 扩展 属性 的 选取 方法 ,其 中 信息 量 的 多 少 与 米 有 关 。 
(1) 自信 息 量 I(a): 设 信 息 源 X 发 出 符号 a 的 概率 为 p(a), 则 I(a) 定 义 为 
I(a) 二 一 logzp(a) (单位 为 5) 
表示 收 信 者 在 收 到 符号 a 之 前 ,对 于 a 的 不 确定 性 ,以 及 收 到 后 获得 的 关于 a 的 信 
息 量 。 
(2) 信息 灶 互 (X): 设 信息 源 X 的 概率 分 布 为 (+,p(zx)), 则 及 (X) 定 义 为 
H(X) =— > p(x)logs p(x) 
它 表示 信息 源 X 的 整体 的 不 确定 性 ,反映 了 信息 源 每 发 出 一 个 符号 所 提供 的 平均 信 
息 量 。 
(3) 条 件 炉 了 H(X1Y): 设 信息 源 X.Y 的 联合 概率 分 布 为 PCz,y), 则 吾 (XIY) 定 
义 为 





HC(X1Y) = 一 >) Dplr,y)logsplr | y) 
它 表示 收 信 者 在 收 到 Y 后 对 X 的 不 确定 性 的 估计 。 
设 给 定 正 负 实例 的 集合 为 S, 构 成 训练 窗口 。ID3 算法 视 S 为 一 个 离散 信息 系统 ,并 
用 信息 彤 表示 该 系统 的 信息 量 。 当 决策 有 “& 个 不 同 的 输出 时 ,S 的 焙 为 


k 
Eniropy(S) 一 一 >) Pilogs P， 
并 


其 中 ,P; 表示 第 i 类 输出 所 占 训 练 窗口 中 总 的 输出 数量 的 比例 。( 下 面 的 Entropy 简 记 
为 Ent) 
为 了 检测 每 个 属性 的 重要 性 ,可 以 通过 属性 的 信息 增益 Gain 评估 其 重要 性 。 对 于 属 
性 A, 假设 其 值 域 为 (wi ,vs，…,v,), 则 训练 实例 S 中 属性 A 的 信息 增益 Gain 可 以 定义 为 
Ghani(S A) =Enetsy — YY LSil 
i 131 
=En(S)— En(S|A)= H(S)—H(S|A,) 
式 中 ,S; 表 示 S 中 属性 A 的 值 为 w 的 子 集 ;|S; | 表示 集合 的 势 。 
Quinlan 建议 选取 获得 信息 量 最 大 的 属性 作为 扩展 属性 ,这 一 启发 式 规则 又 称 最 小 
炉 原 理 。 因 为 获得 信息 量 最 大 , 即 信 息 增益 Gain 最 大 ,等 价 于 使 其 不 确定 性 最 小 ,即使 得 
炉 最 小 , 即 条 件 炉 也 (S1A;) 为 最 小 。 因 此 也 可 以 以 条 件 炉 有 (S|1A;) 为 最 小 作为 选择 属性 
的 重要 标准 。H(S1A;) 越 小 ,说 明 A; 引入 的 信息 最 多 ,系统 炉 下 降 得 越 快 。ID3 算法 是 
一 种 贪 禁 搜 索 (greedy search) 算 法 , 即 选择 信息 量 最 大 的 属性 进行 决策 树 分 裂 ,计算 中 表 
现 为 使 训练 例子 集 的 炉 下 降 最 快 。 
ID3 算法 的 优点 是 分 类 和 测试 速度 快 ,特别 适合 于 大 数据 库 的 分 类 问题 。 缺 点 是 : 





Ent (S;) 
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决策 树 的 知识 表示 不 如 规则 那样 易于 理解 ;两 棵 决策 树 进行 比较 ,以 判断 它们 是 否 等 价 的 
问题 是 子 图 匹配 问题 ,是 NP 完全 的 ;不 能 处 理 未 知 属性 值 的 情况 ;对 噪声 问题 没有 好 的 
处 理 办 法 。 

求 信息 粹 和 信息 增益 案例 : 以 表 7-3 中 的 西瓜 数据 集 为 例 , 该 数据 集 包 含 17 个 训练 
样 例 , 用 以 学 习 一 棵 能 预测 没 剖 开 的 是 不 是 好 瓜 的 决策 树 。 显 然 ,| 了 | 三 2。 在 决策 树 学 
习 开 始 时 , 根 结 点 包含 D 中 的 所 有 样 例 , 其 中 正 例 占 pi 二 8/17, 反 例 占 ps 二 9/17。 于 是 ， 
根据 信息 炉 求解 公式 可 计算 出 根 结 点 的 信息 炉 为 

































































Ent (D) 三 一 Doogsp, (Bo: 十 和 log， 号 ] 0. 998 
表 7-3 西瓜 数据 集 

编号 色泽 根 蒂 敲 声 纹理 脐 部 触感 好 瓜 
1 青绿 暑 缩 浊 响 清晰 叫 陷 硬 滑 是 
乌黑 里 缩 沉 闽 清晰 叫 陷 硬 滑 是 
3 乌黑 里 缩 浊 响 清晰 四 陷 硬 滑 是 
4 青绿 里 缩 沉 闽 清晰 叫 陷 硬 滑 是 
5 浅 白 里 缩 浊 响 清晰 叫 陷 硬 滑 是 
6 青绿 稍 里 浊 响 清晰 稍 凹 软 黏 是 
7 乌黑 稍 里 浊 响 稍 糊 稍 凹 软 黏 是 
8 乌黑 稍 里 浊 响 清晰 稍 凹 硬 滑 是 
9 乌黑 稍 里 沉闷 稍 糊 稍 凹 硬 滑 否 
10 青绿 硬挺 清脆 清晰 平坦 软 黏 否 
11 浅 白 硬挺 清脆 模糊 平坦 硬 滑 否 
12 浅 白 里 缩 浊 响 模糊 平坦 软 黏 否 
13 青绿 稍 里 浊 响 稍 糊 叫 陷 硬 滑 否 
14 浅 白 稍 里 沉 闽 稍 糊 叫 陷 硬 滑 否 
15 乌黑 稍 里 浊 响 清晰 稍 凹 软 黏 否 
16 浅 白 里 缩 浊 响 模糊 平坦 硬 滑 否 
17 青绿 晓 缩 沉 闯 稍 糊 稍 凹 硬 滑 否 


























然后 ,我 们 要 计算 出 当前 属性 集合 {色泽 , 根 蒂 , 斋 声 , 纹 理 , 脐 部 ,触感 } 中 每 个 属性 的 
信息 增益 。 以 属性 “色泽 ”为 例 , 它 有 3 个 可 能 的 取 值 : {青绿 ,乌黑 , 浅 白 )。 若 使 用 该 属 
性 对 DD 进行 划分 , 则 可 得 到 3 个 子 集 , 分 别 记 为 : D' (色泽 = 青绿 ),D’ (色泽 二 乌黑) ,D3 
(色泽 一 浅 白 ) 。 

子 集 D! 包含 编号 为 {1,4,6,10,13.17} 的 6 个 样 例 ,其 中 正 例 占 户 一 3/6, 反 例 占 ps 
三 3/6;D? 包含 编号 为 {2, 3, 7, 8, 9, 15} 的 6 个 样 例 ,其 中 正 、 反 例 分 别 占 pi 二 4/6,ps 二 
2/6;D? 包含 编号 为 {5,11,12,14,16) 的 5 个 样 例 ,其 中 正 、 反 例 分 别 占 pi 二 1/5, ps 二 4/5。 
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根据 信息 炉 公 式 可 计算 出 用 “色泽 ”划分 之 后 所 获得 的 3 个 分 支 结 点 的 信息 炉 为 
: 3 
6 6 








Ent(D') ( 3 logz 二 十 : log: ] 1. 000 











En (D’) ($1og: : 二 Flog, 可 0.918 


1 4 
5 3 0.722 


根据 信息 增益 公式 可 计算 出 属性 "色泽 ”的 信息 增益 为 
Gain(D, 色 泽 )= Eni(D) 一 六 上 








En (D’) ( Dlogs 二 十 十 log。 





Eni(D*) 


i I 5 
= 0. 998 (总 x 1.000 十 仿 X0.918 十 名 x0.722 


= 0. 109 

类 似 地 ,可 计算 出 其 他 属性 的 信息 增益 。 

Gain(D, 根 带 ) 二 0.143;Gain(D, 敲 声 ) 二 0.141;Gain(D, 纹 理 ) 二 0. 381; 

Gain(DD, 脐 部 ) 二 0.289;Gain(D, 触 感 ) 二 0.006。 

显然 ,属性 “纹理 ”的 信息 增益 最 大 ,于 是 它 被 选 为 划分 属性 。 图 7-8 给 出 了 基于 “ 纹 
理 ” 属 性 对 根 结 点 进行 划分 的 结果 ,各 分 支 结 点 包含 的 样 例子 集 显 示 在 结 点 中 。 
纹理 =? 
清晰 稍 贿 模糊 




















{1,2,3;4,5,6,8, 10,15} {7, 9, 13, 14, 17} {11, 12, 16} 


图 7-8 基于 “纹理 ”属性 对 根 结 点 进行 划分 的 结果 




















7.2.3 基于 范例 的 学 习 


人 们 为 了 解决 一 个 新 间 题 ,会 先进 行 回忆 ,从 记忆 中 找到 一 个 与 新 间 题 相似 的 范例 ， 
然后 把 该 范例 中 的 有 关 信 息 和 知识 复 用 到 新 问题 的 求解 中 。 

在 基于 范例 推理 (Case-Based Reasoning，CBR) 中 ,把 当前 面临 的 问题 或 情况 称 为 目 
标 范例 (target case) ,而 把 记忆 中 的 问题 或 情况 称 为 源 范例 (base case) ,基于 范例 的 推理 
就 是 由 目标 范例 的 提示 而 获得 记忆 中 的 源 范例 ,并 由 源 范例 指导 目标 范例 求解 的 一 种 
策略 。 

基于 范例 的 推理 是 人 工 智 能 领域 中 的 一 种 重要 的 基于 知识 的 问题 求解 和 学 习 的 方 
法 。 在 基于 范例 的 推理 中 ,知识 表示 是 以 范例 为 基础 的 ,范例 的 获取 比 规则 的 获取 要 容 
易 , 大 大 简化 了 知识 的 获取 。 对 过 去 的 求解 结果 进行 复 用 ,而 不 是 再 次 从 头 推导 ,可 以 提 
高 对 新 问题 的 求解 效率 。 过 去 求解 成 功 或 失败 的 经 历 可 以 提示 当前 求解 时 该 怎样 走向 成 
功 或 避 开 失败 ,这样 可 以 改善 求解 的 质量 。 对 于 那些 目前 没有 或 根本 不 存在 的 ,但 可 以 通 
过 计算 推导 解决 的 问题 ,基于 范例 的 推理 能 很 好 地 发 挥 作 用 。 
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1. 基于 范例 推理 的 一 般 过 程 

1) 联想 记忆 

基于 范例 推理 最 初 是 由 于 目标 范例 的 某 些 特殊 性 质 使 人 们 能 够 联想 到 记忆 中 的 源 范 
例 而 产生 的 。 但 它 是 粗糙 的 ,不 一 定 正确 。 在 最 初 的 检索 结束 后 ,需要 证 实 它们 之 间 的 可 
类 比 性 ,这 使 得 系统 需要 进一步 检索 两 个 类 似 体 的 更 多 的 细节 ,探索 它们 之 间 的 更 进一步 
的 可 类 比 性 和 差异 。 在 这 一 阶段 ,已 经 初步 进行 了 一 些 类 比 映射 的 工作 ,只 是 映射 是 局 部 
的 \ 不 完整 的 。 这 个 过 程 结束 后 ,获得 的 源 范例 集 已 经 按 与 目标 范例 的 可 类 比 程度 进行 了 
优先 级 排序 。 

2) 类 比 映射 

从 源 范例 集中 选择 最 优 的 一 个 源 范例 ,建立 它 与 目标 范例 之 间 一 致 的 一 一 对 应 。 

3) 获得 求解 方案 

利用 一 一 对 应 关系 转换 源 范例 的 完整 的 或 部 分 的 求解 方案 ,从 而 获得 目标 范例 的 完 
整 的 或 部 分 的 求解 方案 。 若 目标 范例 得 到 了 部 分 解答 , 则 把 解答 的 结果 加 到 目标 范例 的 
初始 描述 中 ,从 头 开 始 整 个 类 比 过 程 。 若 获得 的 目标 范例 的 求解 方案 未 能 给 目标 范例 以 
正确 的 解答 , 则 需 解释 方案 失败 的 原因 ,调用 修补 过 程 修改 所 获得 的 方案 。 系 统 应 该 记录 
失败 的 原因 ,以 避免 以 后 出 现 同 样 错误 。 

4) 评价 

类 比 求解 的 有 效 性 需要 得 到 评价 。 

基于 范例 推理 的 一 般 结构 如 图 7-9 所 示 。 

基于 范例 的 推理 有 两 种 形式 , 即 问题 求解 型 ”新 问题 
和 解释 型 。 前 者 利用 范例 给 出 问题 的 答案 ,后 者 
把 范例 用 作 辩 护 的 证 据 。 

在 基于 范例 的 学 习 中 要 解决 的 问题 主要 有 以 
下 几 个 。 

(1) 范例 表示 : 基于 范例 推理 的 效率 和 范例 
表示 紧密 相关 。 范 例 表 示 涉 及 这 样 几 个 问题 : 选 
择 什么 信息 存放 在 一 个 范例 中 ;如 何 选择 合适 的 
范例 内 容 的 描述 结构 ;范例 库 如 何 组 织 和 索引 。 
对 于 那些 数量 达到 成 千 上 万 而 且 十 分 复杂 的 范 
例 , 组 织 和 索引 问题 尤其 重要 。 

(2) 分 析 模 型 : 分 析 模型 用 于 分 析 目 标 范例 ， 
从 中 识别 和 抽取 源 范例 库 的 信息 。 

(3) 范例 检索 : 利用 检索 信息 从 源 范例 库 中 检索 并 选择 潜在 的 .可 用 的 源 范例 。 基 
于 范例 推理 的 方法 与 人 类 解决 问题 的 方式 很 相近 。 碰 到 一 个 新 间 题 时 ,首先 是 从 记忆 或 
范例 库 中 回忆 出 与 当前 问题 相关 的 最 佳 范例 。 后 面 所 有 工作 能 否 发 挥 出 应 有 的 作用 ,很 
大 程度 上 依赖 于 这 一 阶段 得 到 的 范例 的 质量 的 高 低 ,因此 这 一 步 非常 关键 。 一 般 来 讲 , 范 
例 匹配 不 是 精确 的 ,只 能 是 部 分 匹配 或 近似 匹配 。 因 此 , 它 要 求 有 一 个 相似 度 的 评价 标 
准 。 该 标准 定义 得 好 ,会 使 得 检索 出 的 范例 十 分 有 用 ,和 否则 将 会 严重 影响 后 面 的 过 程 。 

(4) 类 比 映 射 : 寻找 目标 范例 同 源 范例 之 间 的 对 应 关系 。 





确认 解 建议 解 
图 7-9 基于 范例 推理 的 一 般 结构 
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(5) 类 比 转换 : 转换 源 范例 中 同 目标 范例 相关 的 信息 ,以 便 将 其 应 用 于 目标 范例 的 
求解 过 程 中 ,其 中 涉及 对 源 范例 的 求解 方案 的 修改 。 然 后 ,把 检索 到 的 源 范 例 的 解答 复 用 
于 新 问题 或 新 范例 中 ,并 分 析 源 范例 与 目标 范例 间 有 何不 同 之 处 , 源 范例 中 的 哪些 部 分 可 
以 用 于 目标 范例 。 对 于 简单 的 分 类 问题 , 仅 需要 把 源 范例 的 分 类 结果 直接 用 于 目标 范例 ， 
无 须 考虑 它们 之 间 的 差别 ,因为 实际 上 范例 检索 已 经 完成 了 这 项 工作 。 而 对 于 问题 求解 
之 类 的 问题 , 则 需要 根据 它们 之 间 的 不 同 对 复 用 的 解 进行 调整 。 

(6) 解释 过 程 : 对 把 转换 过 的 源 范例 的 求解 方案 应 用 到 目标 范例 时 所 出 现 的 失败 做 
出 解释 ,给 出 失败 的 因果 分 析 报 告 。 有 时 对 成 功 也 同样 要 做 出 解释 。 基 于 解释 的 索引 也 
是 一 种 重要 的 方法 。 

(7) 范例 修补 : 有 些 类 似 于 类 比 转换 ,区 别 在 于 修补 过 程 的 输入 是 解 的 方案 和 一 个 
失败 报告 ,也 许 还 包含 一 个 解释 ,然后 修改 这 个 解 ,以 排除 会 引起 失败 的 因素 。 

(8) 类 比 验证 : 验证 目标 范例 和 源 范例 进行 类 比 的 有 效 性 。 

(9) 范例 保存 : 新 问题 得 到 解决 , 则 形成 了 一 个 可 能 用 于 将 来 的 情形 与 之 相似 的 问 
题 ,这 时 有 必要 把 它 加 入 到 范例 库 中 ,这 是 学 习 , 也 是 知识 获取 。 此 过 程 涉及 选取 哪些 信 
息 保留 ,以 及 如 何 把 新 范例 有 机 地 集成 到 范例 库 中 。 然 后 ,修改 和 精 化 源 范 例 库 , 其 中 包 
括 泛 化 和 抽象 等 过 程 。 

在 决定 要 选取 范例 的 哪些 信息 进行 保留 时 ,一 般 考虑 以 下 几 点 : 和 问题 有 关 的 特征 
描述 ;问题 的 求解 结果 ;解答 成 功 或 失败 的 原因 及 解释 。 

把 新 范例 加 入 到 范例 库 中 时 ,需要 对 它 建立 有 效 的 索引 ,这 样 以 后 才能 对 之 做 出 有 效 
的 回忆 。 索 引 应 使 得 目标 范例 与 该 范例 有 关 时 能 回忆 得 出 ,与 它 无 关 时 不 应 回忆 得 出 。 
为 此 ,可 能 要 对 范例 库 的 索引 内 容 ,甚至 结构 进行 调整 ,如 改变 索引 的 强度 或 特征 权 值 。 

2. 范例 的 表示 

人 们 记忆 的 知识 彼此 之 间 并 不 是 孤立 的 ,而 是 通过 某 种 内 在 的 因素 相互 之 间 紧 密 地 
或 松散 地 有 机 联系 成 的 一 个 统一 的 体系 ,一 般 使 用 记忆 网 概括 知识 的 这 一 特点 。 一 个 记 
忆 网 是 以 语义 记忆 单元 (SMU) 为 结 点 ,以 语义 记忆 单元 间 的 各 种 关系 为 连接 而 建立 起 来 
的 网 络 。 


SMU = { SMU_NAME slot 
Constraint slots 
Taxonomy slots 
Causality slots 
Similarity slots 
Partonomy slots 
Case slots 
Theory slots 

和 


(1) SMU_NAME slot: 简 记 为 SMU 槽 ,是 语义 记忆 单元 的 概念 性 描述 ,通常 是 一 
个 词汇 或 者 一 个 短语 。 

(2) Constraint slots: 简 记 为 CON 槽 ,是 对 语义 记忆 单元 施加 的 某 些 约束 。 通 常 ,这 
些 约束 并 不 是 结构 性 的 ,只 是 对 SMU 描述 本 身 所 加 的 约束 。 
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(3) Taxonomy slots: 简 记 为 TAX 槽 ,定义 了 与 该 SMU 相关 的 分 类 体系 中 该 SMU 
的 一 些 父 类 和 子 类 。 因 此 , 它 描 述 了 网 络 中 结 点 间 的 类 别 关系 。 

(4) Causality slots: 简 记 为 CAU 槽 ,定义 了 与 该 SMU 有 因果 联系 的 其 他 SMU, 它 
或 者 是 另 一 些 SMU 的 原因 ,或 者 是 另外 一 些 SMU 的 结果 。 因 此 , 它 描述 了 网 络 中 结 点 
间 的 因果 联系 。 

(5) Similarity slots: 简 记 为 SIM 槽 ,定义 了 与 该 SMU 相似 的 其 他 SMU ,描述 网 络 
中 结 点 间 的 相似 关系 。 

(6) Partonomy slots: 简 记 为 PAR 槽 ,定义 了 与 该 SMU 具有 部 分 整体 关系 的 其 
他 SMU。 

(7) Case slots: 简 记 为 CAS 槽 ,定义 了 与 该 SMU 相关 的 范例 集 。 

(8) Theory slots: 简 记 为 THY 槽 ,定义 了 关于 该 SMU 的 理论 知识 。 

上 述 8 类 槽 可 以 总 体 上 分 成 3 大 类 : 第 1 类 反映 各 SMU 之 间 的 关系 ,包括 TAX 槽 、 
CAU 槽 .SIM 槽 和 了 PAR 槽 ;第 2 类 反映 SMU 自身 的 内 容 和 特性 ,包括 SMU 槽 和 THY 
槽 ;第 3 类 反映 与 SMU 相关 的 范例 信息 ,包括 CAS 槽 和 CON 模 。 

3. 范例 组 织 

范例 组 织 由 两 部 分 组 成 : 一 是 范例 的 内 容 , 范 例 应 该 包含 哪些 有 关 的 东西 才能 对 问 
题 的 解决 有 用 ;二 是 范例 的 索引 , 它 与 范例 的 组 织 结构 以 及 检索 有 关 , 反 映 了 不 同 范例 间 
的 区 别 。 

1) 范例 内 容 

a 问题 或 情景 的 描述 。 对 要 求解 的 问题 或 要 理解 的 情景 的 描述 ,一 般 包 括 : 当 范 例 
发 生 时 推理 器 的 目标 ,完成 该 目标 所 要 涉及 的 任务 ,周围 世界 或 环境 与 可 能 的 解决 方案 相 
关 的 所 有 特征 。 

@ 解决 方案 的 内 容 , 描 述 问题 如 何在 一 特定 情形 下 得 到 解决 。 它 可 能 是 对 问题 的 简 
单 解答 ,也 可 能 是 得 出 解答 的 推导 过 程 。 

@ 结果 。 记 录 了 实施 解决 方案 后 的 结果 情况 是 失败 ,还 是 成 功 。 有 了 结果 内 容 ， 
CBR 在 给 出 建议 解 时 就 能 给 出 曾经 成 功 地 工作 的 范例 ,同时 也 能 利用 失败 的 范例 避免 可 
能 会 发 生 的 问题 。 当 对 问题 还 缺乏 足够 的 了 解 时 ,通过 在 范例 的 表示 上 加 上 结果 部 分 能 
取得 较 好 的 效果 。 

2) 范例 索引 

建立 范例 索引 有 如 下 3 个 原则 。 

J@ 索引 与 具体 领域 有 关 。 数 据 库 中 的 索引 是 通用 的 ,目的 仅仅 是 使 得 索引 能 对 数据 
集合 进行 平衡 的 划分 ,从 而 使 得 检索 速度 最 快 ;而 范例 索引 则 要 考虑 是 否 有 利于 将 来 的 范 
例 检索 , 它 决 定 了 针对 某 个 具体 的 问题 哪些 范例 会 被 复 用 。 

@ 索引 应 该 有 一 定 的 抽象 或 泛 化 程度 .这样 才能 灵活 处 理 以 后 可 能 遇 到 的 各 种 情 
景 , 太 具 体 则 不 能 满足 更 多 的 情况 。 

@ 索引 应 该 有 一 定 的 具体 性 ,这 样 才能 在 以 后 能 够 被 容易 地 识别 出 来 , 太 抽象 则 各 
个 范例 之 间 的 差别 将 被 消除 。 

4. 范例 的 检索 

范例 检索 即 从 范例 库 (case base) 中 找到 一 个 或 多 个 与 当前 问题 最 相似 的 范例 的 过 
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程 。CBR 系统 中 的 知识 库 不 是 以 前 专家 系统 中 的 规则 库 , 它 是 由 领域 专家 以 前 解决 过 的 
一 些 问 题 组 成 的 。 范 例 库 中 的 每 一 个 范例 都 包括 以 前 问题 的 一 般 描述 , 即 情景 和 解法 。 
一 个 新 范例 并 入 范例 库 , 同 时 也 建立 了 关于 这 个 范例 的 主要 特征 的 索引 。 当 接受 了 一 个 
求解 新 问题 的 要 求 后 ,CBR 利用 相似 度 知识 和 特征 索引 从 范例 库 中 找 出 与 当前 问题 相关 
的 最 佳 范例 ,由 于 它 所 回忆 的 内 容 , 即 所 得 到 的 范例 质量 和 数量 直接 影响 着 问题 的 解决 效 
果 , 所 以 此 项 工作 比较 重要 。 它 通过 3 个 子 过 程 , 即 特征 辨识 、 初 步 匹 配 、 最 佳 选 定 实现 。 

1) 特征 辨识 

特征 辨识 指 对 问题 进行 分 析 ,提取 有 关 特 征 的 过 程 。 特 征 提取 方式 有 如 下 几 种 。 

@ 从 问题 的 描述 中 直接 获得 问题 的 特征 ,如 自然 语言 对 问题 进行 描述 并 输入 系统 
时 ,系统 可 以 对 句子 进行 关键 词 提取 ,这 些 关键 词 就 是 问题 的 某 些 特征 。 

@ 对 问题 经 过 分 析 理 解 后 ,导出 特征 ,如 图 像 分 析 理 解 中 涉及 的 特征 提取 。 

@ 根据 上 下 文 或 知识 模型 的 需要 从 用 户 那里 通过 交互 方式 获取 特征 。 系 统 向 用 户 
提问 ,以 缩小 检索 范围 ,使 检索 到 的 范例 更 加 准确 。 

2) 初步 匹配 

初步 匹配 指 从 范例 库 中 找到 一 组 与 当前 问题 相关 的 候选 范例 。 这 个 阶段 是 通过 使 用 
上 述 特 征 作 为 范例 库 的 索引 完成 检索 的 。 由 于 一 般 不 存在 完全 的 精确 匹配 ,所 以 要 对 范 
例 之 间 的 特征 关系 进行 相似 度 估计 , 它 可 以 是 基于 上 述 特征 的 与 领域 知识 关系 不 大 的 表 
面 估计 ,也 可 以 是 通过 对 问题 进行 深入 理解 和 分 析 后 的 深层 估计 ,在 具体 做 法 上 , 则 可 以 
通过 对 特征 赋予 不 同 的 权 值 体 现 不 同 的 重要 性 。 相 似 度 评价 方法 有 最 近邻 法 .归纳 法 等 。 

3) 最 佳 选 定 

最 佳 选 定 指 从 初步 匹配 过 程 中 获得 的 一 组 候选 范例 中 选取 一 个 或 几 个 与 当前 问题 最 
相关 的 范例 。 这 一 步 和 领域 知识 关系 密切 ,可 以 由 领域 知识 模型 或 领域 知识 工程 师 对 范 
例 进行 解释 ,然后 对 这 些 解释 进行 有 效 测试 和 评估 ,最 后 依据 某 种 度量 标准 对 候选 范例 进 
行 排序 ,得 分 最 高 的 就 成 为 最 佳 范例 ,如 最 相关 的 或 解释 最 合理 的 范例 可 选 定 为 最 佳 
范例 。 

5. 范例 的 复 用 

通过 对 所 给 问题 和 范例 库 中 范例 的 比较 得 到 新 旧 范 例 的 不 同 ,然后 确定 哪些 解答 部 
分 可 以 复 用 到 新 范例 中 。 问 题 求 解 型 的 CBR 系统 必须 修正 过 去 的 问题 解答 ,以 适应 新 的 
情况 ,因为 过 去 的 情况 不 可 能 与 新 情况 完全 一 样 。 一 般 来 说 ,有 下 列 几 种 修正 方法 。 

1) 替换 法 

替换 法 是 对 旧 解 中 的 相关 值 做 相应 替换 而 形成 新 解 ,有 重新 例 化 、 参 数 调整 、 局 部 搜 
索 ` 查 询 、 特 定 搜索 、 基 于 范例 的 替换 等 。 

2) 常识 转换 法 

常识 转换 法 (common-sense transformation) 是 使 用 明白 易 懂 的 常识 性 启发 式 知 识 从 
旧 解 中 替换 、 删 除 或 增加 某 些 组 成 部 分 。 模 型 制导 修补 法 (model-guided repair) 是 另 一 种 
转换 法 , 它 是 通过 因果 模型 指导 如 何 转换 的 ,故障 诊断 中 就 经 常 使 用 这 种 方法 。 

3) 特定 目标 驱动 法 

特定 目标 驱动 的 修正 一 般 通 过 根据 启发 式 知 识 评价 近似 解 ,从 而 起 到 修正 作用 ,并 通 
过 使 用 基于 规则 的 产生 式 系统 控制 。 
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4) 派生 重演 
派生 重演 方法 则 是 使 用 过 去 推导 出 旧 解 的 方法 推导 出 新 解 。 这 种 方法 关心 的 是 解 是 
如 何 求 出 来 的 。 与 前 面 的 基于 范例 的 替换 法 相 比 ,派生 重演 使 用 的 是 一 种 基于 范例 的 修 
正 手段 。 


7.2.4 解释 学 习 


基于 解释 的 学 习 (explanation-based learning) 可 简称 为 解释 学 习 , 是 20 世纪 80 年 代 中 
期 开始 兴起 的 一 种 机 器 学 习 方 法 。 解 释 学 习 根 据 任务 所 在 领域 知识 和 正在 学 习 的 概念 知 
识 , 对 当前 实例 进行 分 析 和 求解 ,得 出 一 个 表征 求解 过 程 的 因果 解释 树 ,以 获取 新 的 知识 。 
在 获取 新 知识 的 过 程 中 ,通过 对 属性 、 表 征 现 象 和 内 在 关系 等 进行 解释 而 学 习 到 新 的 知识 。 

解释 学 习 一 般 包 括 下 列 3 个 步 又 。 

(1) 利用 基于 解释 的 方法 对 训练 实例 进行 分 析 与 解释 ,以 说 明 它 是 目标 概念 的 一 个 
实例 。 

(2) 对 实例 的 结构 进行 概括 性 解释 ,建立 该 训练 实例 的 一 个 解释 结构 ,以 满足 所 学 概 
念 的 定义 ;解释 结构 的 各 个 叶子 结 点 应 符合 可 操作 性 准则 , 且 使 这 种 解释 比 最 初 的 例子 适 
用 于 更 大 的 一 类 例子 。 

(3) 从 解释 结构 中 识别 出 训练 实例 的 特性 ,并 从 中 得 到 更 大 一 类 例子 的 概括 性 描述 ， 
获取 一 般 控制 知识 。 

解释 学 习 是 把 现 有 的 不 能 用 或 不 实用 的 知识 转化 为 可 用 的 形式 ,因此 必须 了 解 目标 
概念 的 初始 描述 。1986 年 , Mitchell 等 人 为 基于 解释 的 学 习 提出 了 基于 解释 的 概括 
(Explanation-Based Generalization，EBG) 算 法 ,该 算法 建立 了 基于 解释 的 概括 过 程 , 并 
运用 知识 的 逻辑 表示 和 演绎 推理 进行 问题 求解 。EBG 过 程 如 图 7-10 所 示 ,其 求解 问题 
的 形式 可 描述 如 下 。 














可 操作 性 准则 
目标 概念 - 解释 学 习 到 的 新 规则 
训练 例子 二 
领域 知识 库 


图 7-10 EBG 过 程 


给 定 : 

(1) 目标 概念 (要 学 习 的 概念 )(Goal Concept,TC) 描 述 。 

(2) 训练 实例 (目标 概念 的 一 个 实例 ) (Training Example, TE)。 

(3) 领域 知识 (由 一 组 规则 和 事实 组 成 的 用 于 解释 训练 实例 的 知识 库 ) (Domain 
Theory,DT) 。 

(4) 可 操作 性 准则 (说 明 概 念 描述 应 具有 的 形式 化 谓词 公式 ) (Operationality 
Criterion,OC) 。 
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求解 : 

训练 实例 的 一 般 化 概括 ,使 之 满足 : 

(1) 目标 概念 的 充分 概括 描述 TC。 

(2) 可 操作 性 准则 OC。 
其 中 ,领域 知识 (DT) 是 相关 领域 的 事实 和 规则 ,在 学 习 系 统 中 作为 背景 知识 ,用 于 证 明 训 
练 实例 (TE) 为 什么 可 以 作为 目标 概念 的 一 个 实例 ,从 而 形成 相应 的 解释 。TE 是 为 学 习 
系统 提供 的 一 个 例子 ,在 学 习 过 程 中 起 着 重要 的 作用 , 它 应 能 充分 地 说 明 TC。 操 作 准 则 
(OC) 用 于 指导 学 习 系 统 对 目标 概念 进行 取舍 ,使 得 通过 学 习 产 生 的 关于 TC 的 一 般 性 描 
述 成 为 可 用 的 一 般 性 知识 。 

从 上 述 描述 中 可 以 看 出 ,在 解释 学 习 中 ,为 了 对 某 一 目标 概念 进行 学 习 , 从 而 得 到 相 
应 的 知识 ,必须 为 学 习 系 统 提供 完善 的 领域 知识 以 及 能 够 说 明 目 标 概念 的 一 个 训练 实例 。 
在 系统 进行 学 习 时 ,首先 运用 DT 找 出 TE 为 什么 是 TC 之 实例 的 证 明 ( 即 解释 ) ,然后 根 
据 OC 对 证 明 进行 推广 ,从 而 得 到 关于 TC 的 一 般 性 描述 , 即 可 供 以 后 使 用 的 形式 化 表示 
的 一 般 性 知识 。 

可 把 EBG 算法 分 为 解释 和 概括 两 步 。 

(1) 解释 , 即 根据 领域 知识 建立 一 个 解释 ,以 证 明 训 练 实例 如 何 满足 目标 概念 定义 。 
目标 概念 的 初始 描述 通常 是 不 可 操作 的 。 

(2) 概括 , 即 对 第 (1) 步 的 证 明 树 进行 处 理 , 对 目标 概念 进行 回归 ,包括 用 变量 代替 常 
量 以 及 必要 的 新 项 合成 等 工作 ,从 而 得 到 所 期 望 的 概念 描述 。 

由 上 可 知 ,解释 工作 是 将 实例 的 相关 属性 与 无 关 属 性 分 离开 ;概括 工作 则 是 分 析 解 释 
结果 。 


7.2.5 案例 : 通过 EBG 学 习 概 念 cup 


下 面 以 学 习 概 念 cup( 杯 子 ) 为 例 说 明 EBG( 基 于 解释 的 概括 方法 ) 的 学 习 过 程 。 

(1) 目标 概念 : cup。 

(2) 高 级 描述 : cup(x) 。 

(3) 领域 知识 : 

stable(x) Aliftable(x) Mdrinkfrom(x)—>cup(x) 

has(x,y) 人 concavity(y) 人 upward-pointing(y) >drinkfrom(x) 

bottom(x,y) Nflat(y)—>stable(x) 

light-weight(x) Agraspable(x) 一 liftable(x) 

small(x) \ madefrom(x,plastic) 一 light-weight(Cx) 

has(Cx,y) Nhandle(y)—>graspable(x) 

(部 分 中 文 解 释 : stable 稳定 的 ; liftable 便于 拿 起 ; drinkfrom 可 用 来 喝 饮 料 ; 
concavity 凹 空 ; upward-pointing 向 上 指示 ; bottom 底 ;flat 平坦 的 ;light-weight 轻 质 ; 
graspable 可 握 住 ;plastic 塑胶 。) 

(4) 训练 例子 : 

small(obj) ,madefrom(obj ,plastic) ,has(obj.parti ) ,handle(Cpart ) ， 
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has(obj ,parts ) ,concavity(part ) ,upward-pointing(parts ) , bottom (obj,b), flat(b) 。 
(5) 可 操作 性 准则 : 目标 概念 必须 以 系统 可 识别 的 物理 特征 描述 。 
利用 以 上 规则 和 事实 ,以 cup(obj) 为 目标 逆向 推理 ,可 以 构造 如 图 7-11(a) 所 示 的 解 
释 结构 ,其 叶子 结 点 满足 可 操作 性 准则 。 对 解释 进行 概括 , 变 常 量 为 变量 , 便 得 到 概括 后 
的 解释 结构 。 将 此 结构 中 的 所 有 叶子 结 点 作 合 取 ,就 得 到 目标 概念 应 满足 的 一 般 性 的 充 
分 条 件 , 以 产生 式 规则 形式 表示 为 
IF small(V;) Mmade-from(V; ,plastic) \has(V;,Vio) Mhandle(Vio) Mhas(Vs, Vs) 
Nconcavity(Vss) Nupward-pointing(V;s) Nbottom(Vs, V3) 人 flat(Va ) 


THEN cup(Va) (图 7-11(b)) 
学 到 这 条 规则 就 是 EBG 的 目的 。 
cup(obj) 
stable(obj) liftable(obj) drinkfrom(obj) 
bottom(obj,b) flat(obj) has(obj,part,) upward-pointing(part,) 


light-weighted(obj) graspable(obj) concavity(part,) 


small(obj) ”madefrom(obj,plastic) has(obj,part,) handle(part,) 
(a) 解释 结构 


cup(ws) 


stable(v;) liftable(v;) drinkfrom(w) 
bottom(ws,w37) flat(v37) has(vs,ws) upward-pointing(ws) 


light-weighted(ws) graspable(v;) concavity(vs) 


small(ws) madefrom(v;.plastic) has(v.vi0) handle(v,) 
(b) 形成 规则 
图 7-11 EBG 的 学 习 过 程 


7.2.6 强化 学 习 


强化 学 习 (reinforcement learning) 又 称 再 励 学 习 或 评价 学 习 , 是 一 种 重要 的 机 器 学 
习 方 法 。 根 据 机 器 学 习 方 式 的 不 同 ,可 以 把 学 习 算 法 分 为 3 种 类 型 , 即 非 监 督学 习 
(unsupervised learning) ,监督 学 习 (supervised learning) 和 强化 学 习 。 所 谓 强 化 学 习 , 就 
是 智能 系统 从 环境 到 行为 进行 映射 的 学 习 , 目 的 是 使 强化 信和 号 (回报 函数 值 ) 最 大 。 强 化 
学 习 不 同 于 监督 学 习 , 主 要 表现 在 教师 信号 上 ,强化 学 习 中 由 环境 提供 的 强化 信号 会 对 产 
生动 作 的 好 坏 作 一 种 评价 (通常 为 标量 信号 ) ,而 不 是 告诉 强化 学 习 系 统 (Reinforcement 
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Learning System，RLS) 如 何 产生 正确 的 动作 。 巾 于 外 部 环境 提供 的 信息 很 少 ,RLS 必 
须 靠 自身 的 经 历 进 行 学 习 。 通 过 这 种 方式 .RLS 在 行动 -评价 的 环境 中 获得 知识 ,并 改进 
行动 方案 ,以 适应 环境 。 

强化 学 习 要 解决 的 问题 主要 是 主体 怎样 通过 学 习 选 择 达 到 其 目标 的 最 优 动 作 。 当 主 
体 在 其 环境 中 做 出 每 个 动作 时 , 施 教 者 提供 奖励 或 惩罚 信息 ,以 表示 结果 状态 的 正确 与 
否 。 例 如 ,在 训练 主体 进行 棋 类 对 弈 时 , 施 教 者 可 在 游戏 胜利 时 给 出 正 回报 ,在 游戏 失败 
时 给 出 负 回 报 , 其 他 时 候 给 出 零 回 报 。 主 体 的 任务 是 从 这 个 非 直接 的 有 延迟 的 回报 中 学 
习 , 以 便 后 续 动 作 能 够 产生 最 大 的 累积 回报 。 

强化 学 习 的 模型 如 图 7-12 所 示 ,主体 通过 与 环境 的 交互 进行 学 习 。 主 体 与 环境 的 交 
互 接口 包括 动作 、` 回 报 和 状态 。 交 互 过 程 可 以 表述 
为 如 下 形式 : 每 一 步 主体 都 根据 策略 选择 一 个 动作 
执行 ,然后 感知 下 一 步 的 状态 和 回报 ,通过 经 验 再 
修改 自己 的 策略 。 主 体 的 目标 就 是 最 大 化 地 累积 状态 | | 回报 动作 
回报 。 

假设 主体 生存 的 环境 被 描述 为 某 个 可 能 的 状 _ | 
态 集 S, 它 可 以 执行 任意 的 动作 集合 A。 强 化 学 习 一 
系统 接受 环境 状态 的 输入 ,根据 内 部 的 推理 机 制 ， 图 7-12 强化 学 习 的 模型 
系统 输出 相应 的 行为 动作 a, 环境 在 系统 动作 a 下 ， 
变迁 到 新 的 状态 s 。 系 统 接受 环境 新 状态 的 输入 ,同时 得 到 环境 对 于 系统 的 立即 回报 x。 
每 次 在 某 状态 s, 下 执行 一 动作 a,, 主 体会 收 到 一 个 立即 回报 x, 然后 环境 变迁 到 新 的 状 
态 %。 如 此 产生 了 一 系列 的 状态 s;、 动 作 a; 和 立即 回报 ~; 的 集合 。 
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对 于 强化 学 习 系 统 来 讲 , 其 目标 是 学 习 一 个 行为 策略 x: SA, 使 系统 选择 的 动作 能 
够 获得 环境 回报 的 累积 值 最 大 。 换 言 之 ,系统 要 最 大 化 6o 十 yni 十 Y 7 十 …(0 二 7Y<1), 其 
中 y 为 折扣 因子 。 

强化 学 习 技术 的 基本 原理 是 : 如 果 系 统 某 个 动作 导致 环境 正 的 回报 ,那么 系统 以 后 
产生 这 个 动作 的 趋势 便 会 加 强 , 反 之 则 系统 产生 这 个 动作 的 趋势 便 会 减弱 。 这 和 生理 学 
中 的 条 件 反 射 原理 是 接近 的 。 

强化 学 习 框 架 已 经 被 广泛 应 用 在 自动 控制 .调度 ,金融 、 网 络 通信 等 领域 ,在 认 知 、 神 
经 科学 领域 ,强化 学 习 也 有 重要 的 研究 价值 。 例 如 ,Frank 等 人 以 及 Samejima 等 人 在 
Science 上 发 表 了 相关 论文 。 强 化 学 习 也 被 机 器 学 习 领 域 著名 学 者 、 国 际 机 器 学 习 学 会 创 
始 主席 T.G.Dietterich 教授 列 为 机 器 学 习 的 四 大 研究 方向 之 一 。 

强化 学 习 在 实际 问题 上 的 广泛 使 用 还 面临 诸多 挑战 ,主要 包括 特征 表示 、 搜 索 空 间 、 
泛 化 能 力 等 方面 的 问题 。 

经 典 强 化 学 习 的 研究 中 ,状态 和 动作 空间 均 为 有 限 集合 ,每 一 个 状态 和 动作 都 被 分 别 
处 理 。 许 多 应 用 问题 (如 机 械 臂 控制 ) 具 有 连续 的 状态 和 动作 空间 ;即使 对 于 有 限 状 态 空 
间 ( 如 棋盘 格局 ) ,状态 之 间 也 并 非 没 有 联系 。 因 此 ,如 何 将 状态 赋予 合适 的 特质 表示 将 极 
大 地 影响 强化 学 习 的 性 能 。 深 度 学 习 技术 的 应 用 ,特征 可 以 更 有 效 地 从 数据 中 学 习 ， 
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Google DeepMind 的 研究 者 在 Nature 上 发 表 了 基于 深度 学 习 和 Q-Learning 的 强化 学 习 
方法 Deep Q-Network, 在 Atari 2600 游戏 机 上 的 多 个 游戏 取得 “人 类 玩家 水 平 ” 的 成 绩 。 
一 方面 可 以 看 到 特征 的 改进 可 以 提高 强化 学 习 的 性 能 , 另 一 方面 也 观察 到 , Deep 
Q-Network 在 考验 反应 的 游戏 上 表现 良好 ,而 对 于 需要 逻辑 知识 的 游戏 还 远 不 及 人 类 玩家 。 


7.3 基于 神经 网 络 的 机 器 学 习 


神经 网 络 的 研究 提出 了 大 量 的 网 络 模型 ,发 现 了 许多 学 习 算 法 ,对 神经 网 络 的 系统 理 
论 进 行 了 成 功 的 探讨 和 分 析 ,在 此 基础 上 ,人 工 神经 网 络 还 在 模式 分 类 、 机 器 视觉 .机 器 听 
觉 \ 智 能 计算 、 机 器 人 控制 .信号 处 理 \ 组 合 优化 问题 求解 .联想 记忆 编码 理论 、 医 学 诊断 、 
金融 决策 和 数据 挖掘 等 领域 获得 了 卓有成效 的 应 用 。 有 很 多 可 以 应 用 神经 网 络 的 场合 ， 
如 信用 卡 欺 诈 检 测 、 股 市 市 场 预报 、 信 用 打分 、 光 字符 识别 、 机 器 状态 监视 、 公 路 车 辆 自动 
驾驶 仪 等 。 


7.3.1 神经 网 络 概述 


本 节 主 要 介绍 当前 在 众多 科学 领域 中 广泛 应 用 的 神经 网 络 原理 及 其 学 习 算 法 。 它 们 
可 以 分 成 4 种 类 型 , 即 前 馈 型 .反馈 型 .随机 型 和 自 组 织 竞争 型 。 在 神经 网 络 的 结构 确定 
后 ,关键 的 问题 是 设计 一 个 学 习 速 度 快 ,收敛 性 好 的 学 习 算 法 。 

1. 基本 的 神经 网 络 模 型 

前 馈 型 神经 网 络 是 数据 挖掘 中 广 为 应 用 的 一 种 网 络 ,其 原理 或 算法 也 是 其 他 一 些 网 
络 的 基础 。 

径 向 基 函 数 (RBF) 神 经 网 络 也 是 一 种 前 馈 型 神经 网 络 ,可 以 认为 它 是 一 种 通过 改变 
神经 元 非 线 性 变换 函数 的 参数 以 实现 非 线 性 映射 ,并 由 此 而 导致 连接 权 值 调整 的 线性 化 ， 
从 而 提高 学 习 速 度 的 神经 网 络 。 由 于 RBF 网 络 学 习 收 敛 速度 较 快 ,所 以 近年 来 在 数据 挖 
气 中 受到 重视 ,特别 是 在 支持 向 量 机 理论 的 应 用 和 研究 逐步 深入 之 后 。 

Hopfield 神经 网 络 是 反馈 型 网 络 的 代表 。 网 络 的 运行 是 一 个 非 线性 的 动力 学 系统 ， 
所 以 比较 复杂 。Hopfield 神经 网 络 已 在 联想 记忆 和 优化 计算 中 得 到 成 功 应 用 。 

优化 计算 过 程 中 陷入 局 部 极 小 一 直 是 长 期 以 来 困扰 人 们 的 一 个 问题 。 具 有 随机 性 值 
的 模拟 退火 (SA) 算 法 就 是 针对 这 一 问题 而 提出 来 的 ,并 已 在 神经 网 络 的 学 习 及 优化 计算 
中 得 到 成 功 应 用 。Boltzmann 机 是 具有 随机 输出 值 单元 的 随机 神经 网 络 , 串 行 的 
Boltzmann 机 可 以 被 看 作 是 对 二 次 组 合 优化 问题 的 模拟 退火 算法 的 具体 实现 ,同时 它 还 
可 以 模拟 外 界 的 概率 分 布 ,实现 概率 意义 上 的 联想 记忆 。 

自 组 织 竞 争 型 神经 网 络 的 特点 是 能 识别 环境 的 特征 ,并 自动 聚 类。 它们 在 特征 抽取 
和 大 规模 数据 处 理 中 已 有 极 成 功 的 应 用 。 

2. 神经 网 络 的 学 习 方 法 

神经 网 络 的 性 质 主要 取决 于 以 下 两 个 因素 : 一 个 是 网 络 的 拓扑 结构 ; 另 一 个 是 网 络 
的 权 值 工作 规则 。 二 者 结合 起 来 就 可 以 构成 一 个 网 络 的 主要 特征 。 

随 着 网 络 结构 和 功能 的 不 同 ,网 络 权 值 的 学 习 算 法 也 不 同 。 关 于 各 种 网 络 的 具体 算 
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法 将 在 以 后 给 出 ,本 处 仅 针对 神经 网 络 基 本 学 习 算 法 的 含义 及 特点 作 简要 介绍 。 

神经 网 络 的 学 习 问 题 就 是 网 络 的 权 值 调整 问题 。 神 经 网 络 的 连接 权 值 的 确定 一 般 有 
两 种 方式 : 一 种 是 通过 设计 计算 确定 , 即 所 谓 死记 式 学 习 ; 男 一 种 是 网 络 按 一 定 的 规则 通 
过 学 习 ( 训 练 ) 得 到 的 。 大 多 数 的 神经 网 络 都 使 用 后 一 种 方法 确定 其 网 络 权 值 。 

从 学 习 过 程 的 组 织 与 管理 而 言 ,分 有 监督 学 习 与 无 监督 学 习 ; 从 学 习 过 程 的 推理 和 决 
策 方式 而 言 , 分 确定 性 学 习 、 随 机 学 习 和 模糊 学 习 。 下 面 简 要 介绍 几 种 学 习 方 法 。 

(1) 死记 式 学 习 : 网 络 的 连接 权 值 是 根据 某 种 特殊 的 记忆 模式 设计 而 成 的 ,其 值 不 
变 。 在 网 络 输入 相关 信息 时 ,这 种 记忆 模式 就 会 被 回忆 起 来 。Hopfield 网 络 作 联 想 记忆 
和 优化 计算 时 就 属于 这 种 情况 。 

(2) 有 监督 学 习 ( 也 称 有 教师 学 习 ): 在 这 种 学 习 中 学 习 的 结果 , 即 网 络 的 输出 有 一 
个 评价 的 标准 ,网 络 将 实际 输出 和 评价 标准 进行 比较 ,由 其 误差 信号 决定 连接 权 值 的 调 
整 。 评 价 标准 是 由 外 界 提示 给 网 络 的 ,相当 于 由 有 一 位 知道 正确 结果 的 教师 示 教 给 网 络 。 
在 这 种 学 习 中 ,网 络 的 连接 权 值 一 般 根据 6 规则 进行 调整 。 

(3) 自 组 织 学 习 : 是 网 络 根据 某 种 规则 反复 地 调整 连接 权 值 以 适应 输入 模式 的 激 
励 , 指 导 网 络 最 后 形成 某 种 有 序 状态 。 也 可 说 神经 元 对 输入 模式 不 断 适 应 ,从 而 抽取 输入 
信号 的 特征 (如 统计 特征 )。 一 旦 网 络 完成 了 对 输入 信号 的 编码 , 当 它 再 现时 ,就 能 把 它 识 
别 出 来 。 在 自 组 织 学 习 中 ,常用 的 学 习 规则 有 Hebb 学 习 规则 和 相近 学 习 规则 ,前 者 产生 
自 放大 作用 ,后 者 产生 竞争 作用 ; 故 自 组 织 学 习 是 通过 自 放大 、 竞 争 以 及 协调 等 作用 实现 
的 。 输 入 数据 的 完 余 为 神经 网 络 提供 知识 ,如 根据 输入 数据 的 统计 特征 可 以 得 到 一 些 知 
识 。 如 果 没 有 这 种 完 余 性 , 则 自 组 织 学 习 就 不 能 发 现 输入 数据 中 的 任何 模式 或 特征 , 故 数 
据 宛 余 性 是 自 组 织 学 习 的 必要 条 件 。 

(4) 无 监督 学 习 ( 也 称 无 教师 学 习 ): 是 一 种 自 组 织 学 习 , 此 时 网 络 的 学 习 完 全 是 一 
种 自我 调整 的 过 程 ,不 存在 外 部 环境 的 示 教 ,也 不 存在 来 自 外 部 环境 的 反馈 指示 网 络 期 望 
输出 什么 或 者 当前 输出 是 否 正确 。 

无 监督 学 习 可 以 实现 主 分 量 分 析 (principle component analysis)、 聚 类 (clustering) 、 
编码 (encoding) 以 及 特征 映射 (feature mapping) 的 功能 。 

(5) 竞争 学 习 : 是 无 监督 学 习 的 一 种 方法 。 网 络 在 学 习 时 ,以 某 种 内 部 规则 (与 外 部 
环境 无 关 ) 确 定 竞争 层 “ 获 胜 ” 神 经 元 ,其 输出 为 1, 其 他 神经 元 输出 为 0, 连接 权 值 的 调整 
仅 在 获胜 神经 元 (或 包括 其 邻 域 神经 元 ) 与 输入 神经 元 间 进 行 ,其 他 不 变 。 此 时 连接 权 值 
的 学 习 规 则 可 按 下 式 计算 。 

wot+1) = wy(D) ta(t)(z) — wd)) 
其 中 ,xz 为 输入 信号,j 二 1,2,…,n;a(1) 为 1 时刻 的 学 习 系数 。 

(6) 有 监督 与 无 监督 的 混合 学 习 : 有 监督 学 习 具 有 分 类 精细 ,准确 的 优点 ,但 学 习 过 程 
复杂 。 无 监督 学 习 具 有 分 类 灵活 、 算 法 简练 的 优点 ,但 学 习 过 程 较 慢 。 如 果 将 两 者 结合 起 
来 ,发 挥 各 自 的 优点 ,就 有 可 能 成 为 一 种 有 效 的 学 习 方法 。 混合 学 习 过 程 一 般 事 先 用 无 监督 
学 习 抽取 输入 数据 的 特征 ,然后 将 这 种 内 部 表示 提供 给 有 监督 学 习 进 行 处 理 , 以 达到 输入 输 
出 的 某 种 映射 。 由 于 对 输入 数据 进行 了 预 处 理 , 将 会 使 有 监督 学 习 以 及 整个 学 习 过 程 加 快 。 

(7) Boltzmann 学 习 : 是 一 种 随机 学 习 方式 。 

(8) 模糊 学 习 : 是 一 种 以 模糊 理论 为 基础 的 学 习 方法 ,其 特点 是 学 习 过 程 用 模糊 值 
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(隶属 度 ) 进 行 学 习 , 即 输入 量 是 经 过 模糊 化 后 的 模糊 量 。 

(9) 强化 学 习 (reinforcement learning): 有 监督 学 习 时 假定 对 每 一 个 输入 模式 都 有 
一 个 正确 的 目标 输出 。 而 强化 学 习 是 外 界 环境 仅 给 出 对 当前 输出 的 一 个 评价 ,不 会 给 出 
具体 的 期 望 输出 是 多 少 。 

3. 神经 网 络 的 性 质 和 能 力 

神经 网 络 有 以 下 性 质 和 能 力 。 

(1) 非 线性 。 一 个 人 工 神经 元 可 以 是 线性 的 或 者 是 非 线性 的 。 一 个 由 非 线 性 神经 元 
互联 而 成 的 神经 网 络 自身 是 非 线性 的 ,并 且 非 线性 是 一 种 分 布 于 整个 网 络 中 的 特殊 性 质 。 

(2) 输入 输出 映射 。 从 一 个 训练 集中 随机 选取 一 个 样本 给 网 络 ,网 络 就 调整 它 的 突 
触 权 值 (自由 参数 ) ,以 最 小 化 期 望 响应 和 由 输入 信号 以 适当 的 统计 准则 产生 的 实际 响应 
之 间 的 差别 。 使 用 训练 集中 的 很 多 样本 重复 神经 网 络 的 训练 ,直到 网 络 到 达 没 有 显著 的 
突 触 权 值 修正 的 稳定 状态 为 止 。 先 前 用 过 的 样本 可 能 还 要 在 训练 期 间 以 不 同 顺序 重复 使 
用 。 因 此 ,对 当前 问题 网 络 通过 建立 输入 输出 映射 从 样本 中 进行 学 习 。 

(3) 适应 性 。 神 经 网 络 戏 入 了 一 个 调整 自身 连接 权 值 以 适应 外 界 变化 的 能 力 。 

(4) 证 据 响应 。 在 模式 识别 的 问题 中 ,神经 网 络 可 以 设计 成 既 提 供 选择 哪 一 个 特定 
模式 的 信息 ,也 提供 决策 的 置信 度 的 信息 。 

(5) 背景 信息 。 神 经 网 络 的 特定 结构 和 激发 状态 代表 知识 。 网 络 中 每 一 个 神经 元 潜 
在 地 都 受 网 络 中 所 有 其 他 神经 元 全 局 活动 的 影响 。 

(6) 容错 性 。 一 个 以 硬件 形式 实现 后 的 神经 网 络 有 天 生 容 错 的 潜质 ,或 者 鲁 棒 计 算 
的 能 力 。 

(7) VLSI 实现。 神经 网 络 的 大 规模 并 行 性 使 它 具 有 快速 处 理 某 些 任务 的 潜在 能 力 。 
这 一 特性 使 得 神经 网 络 很 适合 用 超大 规模 集成 (VLSI) 技 术 实 现 。 

(8) 分 析 和 设计 的 一 致 性 。 神 经 网 络 作 为 信息 处 理 器 具有 通用 性 。 

(9) 神经 生物 类 比 。 神 经 网 络 的 设计 是 由 对 大 脑 的 类 比 引发 的 ,大 脑 是 一 个 容错 的 
并 行 处 理 的 活生生 的 例子 ,说 明 这 种 处 理 不 光 在 物理 上 是 可 实现 的 ,而 且 还 是 快速 高 效 
的 。 神 经 生物 学 家 将 人 工 神 经 网 络 看 作 是 一 个 解释 神经 生物 现象 的 研究 工具 。 

4. 神经 元 模型 

神经 元 是 神经 网 络 操作 的 基本 信息 处 理 单位 。 图 7-13 描述 了 神经 元 的 非 线性 模型 ， 
它 是 人 工 神经 网 络 的 设计 基础 。 下 面 给 出 神经 元 模型 的 3 种 基本 元 素 。 
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图 7-13 神经 元 的 非 线性 模型 


(1) 突 触 ,用 其 权 值 标识 。 特 别 是 ,在 连 到 神经 元 & 的 突 触 i 上 的 输入 信号 z 被 乘 以 
k 的 权重 ws。 注 意 ,在 突 触 权 植 ws 中 ,第 一 个 下 标 指 输出 神经 元 ,第 二 个 下 标 指 权 值 所 





一 一 


人 工 乔 能 ( 荔 3 瞩 ) 


在 的 突 触 的 输入 端 。 人 工 神 经 元 的 突 触 权 值 有 一 个 范围 ,可 以 取 正 值 ,也 可 以 取 负 值 。 
(2) 加 法 器 ,用 于 求 输入 信号 被 神经 元 的 相应 突 触 权 值 加 权 的 和 。 这 个 操作 构成 一 
个 线性 组 合 器 。 
(3) 激活 函数 ,用 来 限制 神经 元 输出 振幅 。 由 于 它 将 输出 信号 压制 (限制 ) 到 允许 范 
围 内 的 一 定 值 ,所 以 ,激活 函数 也 称 为 压制 函数 。 通 常 , 一 个 神经 元 输出 的 正常 幅度 范围 
可 写成 闭 区 间 [0,1J 或 者 [一 1, 十 1]。 
图 7-13 也 包括 一 个 外 部 偏 置 , 记 为 5 。 根 据 其 为 正 或 为 负 , 它 用 来 增加 或 降低 激活 
函数 的 网 络 输入 。 
可 以 用 如 下 两 个 等 式 描述 一 个 神经 元 k。 
Pr (天 入 
和 
ye = pu tt bi) E72 
其 中 ,zi ,zo ，… ,zn 是 输入 信号 ;ron ,tz，… ,rw 是 神经 元 & 的 突 触 权 值 ;wu 是 输入 信号 的 
线性 组 合 器 的 输出 , 阔 值 为 b ,激活 函数 为 pg(，) ;ys 是 神经 元 输出 信号。 国 值 & 的 作用 是 
对 图 7-13 模型 中 的 线性 组 合 器 的 输出 wu 作 仿 射 变换 (affine transformation) ,如 下 所 示 。 
w= 二 bs (7-3) 
特别 地 ,根据 偏 置 b 取 正 或 取 负 ,神经 元 的 诱导 局 部 域 (induced local field)w 和 线 
性 组 合 器 输出 ww 的 关系 如 图 7-14 所 示 。 注 意 ， 








: 赣 值 w>0 
所 一 0 时 ,yh 二 un。 WA bi0 
偏 置 b 是 人 工 神经 元 k 的 外 部 参数 。 可 以 bi<0 
像 在 式 (7-2) 中 一 样 考虑 它 。 同 样 ,可 以 结合 3 线性 组 台 器 输出 i 


| 
(7-1) 和 式 (7-3) 得 到 如 下 公式 。 | 


vi = >)zowzi (7-4) 
条 和 图 7-14 阅 值 产生 的 仿 射 变换 
ye = pl) (7-5) 


在 式 (7-4) 中 ,我 们 加 上 一 个 新 的 突 触 ,输入 是 zo 二 十 1, 权 值 是 rwo 一 入。 

激活 函数 记 为 pg(v) ,利用 诱导 局 部 域 v 定 义 神经 元 输出 。 下 面 给 出 3 个 基本 的 激活 
函数 。 

〇 国 值 函数 (threshold function) 。 








1，v 宇 0 
yp(o) = (7-6) 
0, v=0 
@ 分 段 线性 函数 (piecewise-linear function) 。 
1, 0 之 + 去 
(Co) = jo 二 二， 十 少 之 vw> 一 二 (7-7) 
9 2 
1 
0， 也 所 一 二 
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这 种 形式 的 激活 函数 是 对 非 线性 放大 器 的 近似 。 
@ sigmoid 函数 。 
此 函数 的 图 形 是 S- 形 的 , 它 是 严格 递增 函数 ,常用 下 面 两 种 形式 。 
a，logistic 函数 。 


1 
1 十 exp( 一 au) 


其 中 ,a 是 sigmoid 函数 的 倾斜 参数 。 改 变 参 数 a 就 可 以 改变 倾斜 程度 。 实 际 上 ,在 
原点 的 斜 度 等 于 a/4。 
b. 双 曲 正切 函数 (hyperbolic tangent function ) 。 
9(v) = tanh(v) 


g(v) = 


值 域 是 一 1 一 1。 

5. 网 络 结构 

神经 网 络 的 构筑 是 和 网 络 学 习 算 法 紧密 连接 的 。 一 般 来 说 ,可 以 区 分 3 种 基本 不 同 
的 网 络 结构 。 

1) 单 层 前 馈 网 络 

在 分 层 网 络 中 ,神经 元 以 层 的 形式 组 织 。 在 最 简单 的 分 层 网 络 中 , 源 结 点 构成 输入 
层 , 直 接 投射 到 神经 元 输出 层 (计算 结 点 ) 上 。 这 种 网 
络 是 严格 地 无 圈 或 前 馈 性 的 。 如 图 7-15 所 示 ,输出 
输入 层 各 有 4 个 结 点 。 此 网 络 称 为 单 层 网 ,“ 单 层 ” 指 
的 是 计算 结 点 (神经 元 ) 输 出 层 。 我 们 不 把 输入 层 计 
算 在 内 ,因为 在 这 一 层 没 有 计算 。 

2) 多 层 前 馈 网 络 

第 二 种 前 馈 网 络 有 一 个 或 多 个 隐藏 结 点 层 , 相 应 
的 计算 结 点 也 被 称 为 隐藏 神经 元 。 隐 藏 神经 元 的 功 
能 是 以 某 种 有 用 方式 介入 外 部 输入 和 网 络 输出 中 。 ” 源 结 点 输入 层 ”神经 元 输出 层 
加 上 一 个 或 多 个 隐藏 层 , 网 络 可 以 得 到 高 阶 统计 特 图 7-15 单 层 前 馈 或 无 图 神经 元 网 络 
性 。 即 使 网 络 为 局 部 连接 ,由 于 额外 的 突 触 连接 和 额 
外 的 神经 交互 作用 ,可 以 使 网 络 在 不 那么 严格 意义 下 获得 一 个 全 局 关系 。 当 输入 层 很 大 
的 时 候 , 隐 藏 层 的 提取 高 阶 统计 特性 的 能 力 就 更 有 价值 了 。 

输入 层 的 源 结 点 提供 激活 模式 的 元 素 ( 输 入 向 量 ) ,组 成 第 二 层 ( 第 一 隐 层 ) 神 经 元 (计算 
结 点 ) 的 输入 信号 。 第 二 层 的 输出 信号 作为 第 三 层 输入 ,这 样 一 直 传递 下 去 。 通 常 ,每 一 层 
的 输入 都 是 上 一 层 的 输出 ,最 后 的 输出 层 给 出 相对 于 源 结 点 的 激活 模式 的 网 络 输出 。 具 有 
一 个 隐藏 层 和 输出 层 的 链接 前 馈 网 络 如 图 7-16 所 示 。 这 是 一 个 10-4-2 网 络 , 即 10 个 源 结 
点 ,4 个 隐藏 结 点 ,2 个 输出 结 点 。 具 有 mm 个 源 结 点 的 前 馈 网 络 , 第 一 个 隐藏 层 有 ha 个 神经 
元 ,第 二 个 隐藏 层 有 hs 个 神经 元 ,输出 层 有 4 个 神经 元 ,可 以 称 为 mhi -hs-g 网 络 。 

图 7-16 的 网 络 也 可 以 称 为 完全 连接 (fully connected) 网 络 。 相 邻 层 的 任意 一 对 结 点 
都 有 连接 。 如 果 不 是 这 样 ,我 们 就 称 为 部 分 连接 (partially connected) 网络 。 

3) 递归 网 络 

递归 网 络 (recurrent networks) 和 前 馈 网 络 (feedforward neural networks) 的 区 别 在 
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EC 一 
源 结 点 输入 层 ” 隐藏 神经 元 层 ”输出 神经 元 层 
图 7-16 具有 一 个 隐藏 层 和 输出 层 的 全 连接 前 馈 网 络 
于 它 至 少 有 一 个 反馈 环 。 如 图 7-17 所 示 , 单 层 网 络 的 每 一 个 神经 元 的 输出 都 反馈 到 所 有 


其 他 神经 元 的 输入 中 。 这 个 图 中 描绘 的 结构 没有 自 反馈 环 , 自 反馈 环 表示 神经 元 的 输出 
反馈 到 它 自 己 的 输入 上 。 图 7-17 没有 隐藏 层 。 递 归 网 络 可 以 包含 隐藏 层 。 














单位 延迟 
算 子 
























































图 7-17 无 自 反 馈 环 和 隐藏 神经 元 的 递归 网 络 


反馈 环 的 存在 对 网 络 的 学 习 能 力 和 它 的 性 能 有 深刻 的 影响 。 此 外 ,由 于 反馈 环 涉及 
使 用 时 间 延 迟 算 子 ( 记 为 2 一) 构成 的 特殊 分 支 ,假如 神经 网 络 包含 非 线性 单元 ,这 就 会 导 
致 非 线 性 的 动态 行为 。 


7.3.2 基于 反 向 传播 网 络 的 学 习 


误差 反 向 传播 算法 基于 误差 纠正 学 习 规 则 。 误 差 反 向 传播 学 习 由 两 次 通过 网 络 不 同 
层 的 传播 组 成 : 一 次 前 向 传播 和 一 次 反 向 传播 。 在 前 向 传播 中 ,一 个 活动 模式 (输入 向 
量 ) 作 用 于 网 络 感知 结 点 , 它 的 影响 通过 网 络 一 层 接 一 层 地 传播 。 最 后 产生 一 个 输出 作为 
网 络 的 实际 响应 。 在 前 向 传播 中 ,网 络 的 突 触 权 值 全 被 固定 了 。 在 反 向 传播 中 , 突 触 权 值 
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全 部 根据 突 触 修正 规则 调整 。 特 别 是 网 络 的 目标 响应 减 去 实际 响应 而 产生 误差 信号 。 这 
个 误差 信和 号 反 向 传播 通过 网 络 , 与 突 触 连接 方向 相反 ,因此 叫 “ 误 差 反 向 传播 "。 突 触 权 值 
被 调整 使 得 网 络 的 实际 响应 从 统计 意义 上 接近 目标 响应 。 误 差 反 向 传播 算法 通常 称 为 反 
向 传播 算法 (back-propagation algorithm) ,或 是 简单 称 为 反 向 传播 (back-prop)。 由 算法 
执行 的 学 习 过 程 被 称 为 反 向 传播 学 习 。 反 向 传播 算法 的 发 展 是 神经 网 络 发 展 史上 的 一 个 
里 程 碑 , 因 为 它 为 训练 多 层 感知 器 提供 了 一 个 有 效 的 计算 方法 。 

1. 预备 知识 

图 7-18 给 出 了 一 个 含有 两 个 隐藏 层 和 一 个 输出 层 的 多 层 感知 器 的 结构 图 。 为 了 给 
出 多 层 感知 器 一 个 一 般 形 式 的 描述 ,这 里 说 的 网 络 是 全 连接 的 。 也 就 是 说 ,在 任意 层 上 的 
一 个 神经 元 与 它 之 前 层 上 的 所 有 结 点 /神经 元 都 连接 起 来 了 。 信 号 在 一 层 接 一 层 的 基础 
上 逐步 传播 ,方向 是 向 前 的 ,从 左 到 右 的 。 




















输入 层 第 一 隐藏 层 。 ”第 二 隐藏 层 
图 7-18 具有 两 个 隐藏 层 和 一 个 输出 层 的 多 层 感 知 器 的 结构 图 


输出 神经 元 (计算 结 点 ) 构 成 了 网 络 的 输出 层 , 余 下 的 神经 元 (计算 结 点 ) 组 成 了 网 络 
的 隐藏 层 。 因 此 ,隐藏 层 单元 并 不 是 网 络 输出 或 输入 层 的 一 部 分 。 第 一 隐藏 层 的 信号 是 
从 由 感知 单元 组 成 输入 层 输入 的 ;而 它 的 结果 信号 也 顺序 传输 给 下 一 个 隐藏 层 ;网 络 的 其 
余部 分 以 此 类 推 。 

多 层 感 知 器 每 一 个 隐藏 层 或 输出 层 的 神经 元 都 被 设计 用 来 进行 两 种 计算 。 

(1) 在 输出 端 神经 元 的 函数 信号 的 计算 , 它 表 现 为 输入 信号 和 与 该 神经 元 有 关 的 突 
触 权 值 的 一 个 连续 非 线 性 函数 。 

(2) 梯度 向 量 ( 即 误差 曲面 对 一 个 神经 元 输入 相连 接 的 权 值 的 梯度 ) 的 估计 计算 , 它 

反 向 传播 算法 的 导出 相当 复杂 ,要 减轻 这 个 导出 所 涉及 的 数学 负担 ,我 们 给 出 在 推导 
中 用 到 的 符号 。 

定义 7.1 

(1) 符号 jk 是 指 网 络 中 不 同 的 神经 元 ;信号 在 网 络 中 从 左 向 右 传播 ,神经 元 j 所 
在 层 在 神经 元 i 所 在 层 的 右边 ,而 当 神 经 元 j 是 隐藏 层 单元 时 ,神经 元 所 在 层 在 神经 元 
了 所 在 层 的 左边 。 

(2) 在 迭代 (时 间 步 2, 网 络 的 第 盖 个 训练 模式 (例子 ) 呈 现 给 网 络 。 
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(3) 符号 E(n) 指 迭代 时 的 瞬间 误差 平方 和 或 瞬间 误差 能 量 和 。 关 于 所 有 n( 即 整 
个 训练 集 ) 的 E(n) 的 平均 值 即 为 平均 误差 能 量 已 。 。 

(4) 符号 e;(n) 指 的 是 第 次 迭代 神经 元 j 的 输出 误差 信和 号。 

(5) 符号 d; (m0) 指 的 是 关于 j 的 期 望 响应 。 

(6) 符号 yj(n) 指 的 是 迭代 时 出 现在 神经 元 7 的 输出 处 函数 信号 。 

(7) 符号 wi (n) 指 突 触 权 值 ,该 权 值 是 迭代 时 从 神经 元 i 输出 连接 到 神经 元 j 输 
入 。 该 权 值 在 迭代 时 修正 量 为 Arwi (n)。 

(8) 迭代 时 的 神经 元 j 的 诱导 局 部 域 ( 所 有 突 触 输入 的 加 权 和 加 上 偏 置 ) 用 vw; (n) 
表示 ; 它 构成 作用 于 神经 元 j 的 激活 函数 的 信和 号。 

(9) 用 来 描述 神经 元 j 的 输入 输出 函数 的 非 线 性 关系 的 激活 函数 表示 为 pg;(，* )。 

(10) 关于 神经 元 j 的 偏 置 用 5; 表示 ; 它 的 作用 由 一 个 突 触 的 权 值 wo 二 5; 表示 ,这 
个 突 触 与 一 个 等 于 十 1 的 固定 输入 相连 。 

(11) 输入 向 量 的 第 i 个 元 素 用 zx;(n) 表 示 。 

(12) 输出 向 量 的 第 个 元 素 用 oi (nn) 表示 。 

(13) 学 习 率 参数 记 为 7。 

(14) 符号 m, 表示 多 层 感知 器 的 第 1 层 的 大 小 (也 就 是 结 点 的 数目 ) ,!=0,1,…', 工 ， 
而 工 就 是 网 络 的 “深度 ”。 因 此 ,mo 是 输入 层 的 大 小 ,ma 是 第 1 隐藏 层 的 大 小 ,mz 是 输出 
层 的 大 小 。 也 使 用 mi 二 M。 

2. 反 向 传播 算法 

在 神经 元 j 的 迭代 时 输出 误差 信和 号 ( 即 呈 现 第 个 训练 例子 ) 由 式 (7-8) 表 示 。 

ej(n) 二 dj(n) 一 yj(n) (神经 元 j 是 输出 结 点 ) (7-8) 
我 们 将 神经 元 j 的 误差 能 量 瞬 间 值 定义 为 (1/2)e,*(n)。 相 应 地 ,整个 误差 能 量 的 瞬时 值 
Eln) 即 为 输出 层 的 所 有 神经 元 的 误差 能 量 瞬 间 值 的 和 ;这 些 只 是 那些 误差 信号 可 被 直接 
计算 的 “可 见 ” 神 经 元 。 因 此 ,E(n) 的 计算 公式 是 


oA Be 0 (7-9) 
2 jiEC 


其 中 ,集合 C 包括 所 有 网 络 输出 层 的 神经 元 。 令 N 指 在 训练 集中 样本 的 总 数 。 对 所 及 
求 已 (2 的 和 ,然后 关于 集 的 大 小 规整 化 即 得 误差 能 量 的 均 方 值 ,具体 表示 如 下 。 


N 
Es, = LY En) (7-10) 
Nt 


误差 能 量 的 瞬时 值 E(n) 和 误差 能 量 的 平均 值 下。 是 网 络 所 有 自由 参数 ( 突 触 权 值 和 
偏 置 水 平 ) 的 函数 。 对 一 个 给 定 的 训练 集 ,E。, 表 示 的 代价 函数 作为 学 习性 能 的 一 种 度量 。 
学 习 过 程 的 目的 是 调整 网 络 的 自由 参数 使 已 最 小 。 特 别 地 ,我 们 考虑 一 个 训练 的 简单 
方法 , 即 权 值 在 一 个 模式 接 一 个 模式 的 基础 上 更 新 ,直到 一 个 回合 (epoch) 结 束 , 也 就 是 整 
个 训练 集 均 已 被 网 络 处 理 。 权 值 的 调整 根据 每 次 呈现 给 网 络 的 模式 所 计算 的 相应 误差 进 
行 。 因 此 ,这 些 单个 权 值 在 训练 集 上 的 更 新 的 算术 平均 是 基于 使 整个 训练 集 的 代价 函数 
EE 最 小 化 的 真实 权 值 调整 的 估计 。 

考虑 图 7-19, 它 描绘 了 神经 元 j 被 它 左 边 的 一 层 神经 元 产生 的 一 组 函数 信号 所 馈 
给 。 因 此 ,在 神经 元 j 的 激活 函数 输入 处 产生 的 诱导 局 部 域 v;(n) 是 
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vn) = >) wi yn) (7-11) 
Ed 
神经 元 j 
pea | 
di{nm) 
从 A -1 外 
yn) ) 6 二 二 全 














7-19 ”输出 神经 元 j 的 详细 信号 流 图 


这 里 ,m 是 作用 于 神经 元 7 的 所 有 输入 个 数 ( 不 包括 偏 置 )。 突 触 权 值 wo (相应 的 固定 输 
入 yo 二 十 1) 等 于 神经 元 j 的 偏 置 5;。 所 以 ,在 迭代 时 出 现在 神经 元 j 输出 处 的 函数 信 
号 y;(n) 是 
yi(n) = (00)) 人 
反 向 传播 算法 给 出 了 突 触 权 值 wi (x) 的 一 个 修正 值 Arw (2) , 它 正比 于 E01) 对 wi (n) 
的 偏 导 9E(n)/9vwi (n)。 
根据 微分 的 链 式 规则 ,可 以 将 这 个 梯度 表示 为 
9E(n) 9E(n) 9e(n) 9yj(n) 9v;(n) 
grwi(n) 9e;(n) 9y;(n) 9v;(n) 9rw(n) 


偏 导数 9E(n)/9wi (nn) 代表 一 个 敏感 因子 ,决定 突 触 权 值 wj (n) 在 权 空 间 的 搜索 方向 。 
在 式 (7-9) 两 边 对 ej(n) 取 微分 ,得 到 





(7-13) 














9E(n) _ . 
= ej(n) (7-14) 
在 式 (7-8) 两 边 对 y;(n) 取 微分 ,得 到 
9e;(n) 
Sa 
apn) 1 (7-15) 
接着 ,在 式 (7-12) 两 边 对 vj(n) 取 微分 ,得 到 
9y;(n) / 
一 一 一 一 一 
5 9g; (vi(n)) (7-16) 
最 后 ,在 式 (7-11) 两 边 对 wj (n) 取 微分 ,得 到 
9v(n) _ _ 
a yi(n) 《人 
将 式 (7-14) 一 式 (7-17) 代 入 式 (7-13) ,得 到 
9E(n) _ / 时 
rr ei (no (vi(n)) y(n) (7-18) 


wi (n) 的 修正 值 Awj (n) 是 由 delta 规则 定义 的 。 
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9E(n) 
Gra (n) 


其 中 ,7 是 反 向 传播 算法 的 学 习 率 参 数 , 式 (7-19) 中 的 负 号 是 指 在 权 空间 中 梯度 下 降 ( 寻 
找 一 个 使 ECz) 值 下 降 方向 ) 。 于 是 ,将 式 (7-18) 代 入 式 (7-19) 中 ,得 到 


Awi (2) 一 一 了 





{7-29> 





Avwi(n) = 0;(n) y;(n) (7-20) 
这 里 ,局 域 梯度 
__ 9E(n) 
6;(n)= Bucy 


9E(n) 9e;(n) 9y;(n) 
9e;(n) 9y;(n) 9v;(n) 


= ej op; (v(m) (7-21) 

局 域 梯度 是 指 突 触 权 值 所 需要 的 变化 量 。 根 据 式 (7-21) ,神经 元 j 的 局 域 梯度 6;(n) 
等 于 相应 误差 信号 e; (n) 和 相应 激活 函数 的 导数 gy (vj (n) ) 的 乘积 。 

从 式 (7-20) 和 式 (7-21) 我 们 注意 到 , 权 值 修正 值 Avwwj (n) 的 计算 涉及 神经 元 j 的 输 
出 端的 误差 信号 ej(n)。 在 这 种 情况 下 ,我 们 要 根据 神经 元 的 不 同位 置 ,区 别 两 种 不 同 的 
情况 。 第 一 种 ,神经 元 j 是 输出 结 点 。 这 种 情况 的 处 理 很 简单 ,因为 网 络 的 每 一 个 输出 结 
点 都 提供 了 自己 的 期 望 反应 信号 ,使 得 计算 误差 信号 成 了 直截了当 的 事 。 在 第 二 种 情况 
中 ,神经 元 j 是 隐藏 层 结 点 。 虽 然 隐藏 层 神经 元 不 能 直接 访问 ,但 是 它们 对 网 络 输出 层 的 
误差 有 影响 。 然 而 ,问题 是 要 知道 对 隐藏 层 神经 元 的 这 种 共 担 责任 如 何 进行 惩罚 或 奖赏 。 
这 已 经 被 网 络 的 反 向 传播 误差 信号 成 功 地 解决 了 。 

下 面 给 出 两 种 情况 下 局 域 梯度 的 计算 方法 。 

情况 1: 神经 元 j 是 输出 结 点 。 

当 神 经 元 j 位 于 网 络 的 输出 层 时 ,给 它 提供 自己 的 一 个 期 望 响 应 。 可 以 用 式 (7-8) 计 
算 这 个 神经 元 的 误差 信号 ej (nn) ; 当 ej (n) 确 定 后 ,用 式 (7-21) 计 算 局 域 梯度 6;(n) 是 很 直 
接 的 。 

情况 2: 神经 元 j 是 隐藏 层 结 点 。 

当 神 经 元 j 位 于 网 络 的 隐藏 层 时 ,就 没有 对 该 输入 神经 元 的 指定 期 望 响应 。 因 此 ,隐藏 
层 的 误差 信号 要 根据 所 有 与 隐藏 层 神经 元 相连 的 神经 元 的 误差 递归 决定 。 这 就 是 为 什么 反 
向 传播 算法 的 发 展 很 复杂 的 地 方 。 如 果 神 经 元 j 是 一 个 网 络 隐藏 层 结 点 ,根据 式 (7-21) 我 
们 可 将 隐藏 层 神经 元 的 局 域 梯度 重新 定义 为 
9E(n) 9y;(n) 

















A 
9E(n) , 一 时 
一 到 09 (vj(n))， 神经 元 1/ 是 隐藏 的 (7-22) 
在 式 (7-22) 中 用 到 了 式 (7-16)。 要 计算 偏 导 
9E(n)/9y;(n) 
须 进 行 如 下 处 理 : 
ECoD) 一 去 eCm) (神经 元 4 是 输出 结 点 ) (7-23) 
kEC 


kk 就 是 式 (7-9) 中 的 j, 这 么 写 是 为 了 避免 与 隐藏 层 结 点 j 相 混 淆 。 在 式 (7-23) 两 边 对 
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yj(n) 求 偏 导 , 得 到 
9E(n) _ ger (n) 
ay Cn) Ze ayw CD) W020 
接着 还 是 使 用 链 式 规则 ,所 以 重 写 式 (7-24) 为 
9E(n) ger (n) 9v(n) 4 
ay CD) er dv (n) av Cn) V2 
然而 ， 
er(n)= di(n) CO— y(n) 
二 di(n) 一 gr(vi(n)) (神经 元 是 输出 结 点 ) (7-26) 
因此 ， 
ger(n) _ | 
hn Pel(ve(n)) (7-27) 
对 神经 元 & 来 说 ,局 部 诱导 域 是 
van) = Dw Dy;(n) (7-28) 


这 里 ,m 是 神经 元 k 所 有 和 输入 的 个 数 (包括 偏 置 ) ,而 且 在 这 里 突 触 权 值 wu (1) 等 于 神经 
元 & 的 偏 置 b(n) ,相应 的 输入 是 固定 在 值 十 1 处 的 。 求 式 (7-28) 关 于 y;(n) 的 微分 ,得 到 





9w(z) _ 村 
5 三 wy (n) (7-29) 
将 式 (7-27) 和 式 (7-29) 代 入 式 (7-25) ,得 到 期 望 的 偏 微分 
9E(n) _ _ , 
a De pro ry Cn) 


一 一 D6 ws (n) (7-30) 
4 


在 式 (7-30) 中 用 到 了 局 域 梯度 2 (z) 的 定义 。 
最 后 ,将 式 (7-30) 代 入 式 (7-22) ,得 到 关于 局 域 梯度 8(z) 的 如 下 反 向 传播 公式 
6 (0 = qi(v(D)) D>)64GDws (n) (神经 元 j 为 隐 单 元 ) (7-31) 


在 式 (7-31) 中 ,与 局 域 梯度 6(n) 的 计算 有 关 的 因素 qi; (vj (nm)) 仅 依赖 于 隐藏 层 神经 
元 j 的 激活 函数 。 这 个 计算 涉及 的 其 余 因 子 也 就 是 所 有 神经 元 的 加 权 和 ,依赖 于 两 组 
项 。 第 一 组 项 (n) 需 要 误差 信和 号 es ln) 的 知识 ,因为 所 有 在 隐藏 层 神经 元 j 右 端 的 神经 
元 都 是 直接 与 神经 元 j 相连 的 。 第 二 组 项 wj (n) 是 由 所 有 这 些 连接 的 突 触 权 值 组 成 的 。 

下 面 总 结 为 反 向 传播 算法 导出 的 关系 。 

(1) 由 神经 元 i 指向 神经 元 j 的 突 触 权 值 的 修正 值 Avwi (n) 由 delta 规则 定义 如 下 。 





权 值 学 习 率 ] 「 局 部 ]f 神经 元 j 
修正 |=| 参数 |.| 梯度 || 输入 信号 (7-32) 
Aroi (n) 7 6; (7) yi(n) 























(2) 局 域 梯度 6;(n) 取 决 于 神经 元 j 是 一 个 输出 结 点 ,还 是 一 个 隐藏 层 结 点 。 

Q@ 如 果 神 经 元 j 是 一 个 输出 结 点 ,6;(n) 等 于 导数 gj (Cu (n)) 和 误差 信号 e (n) 的 乘 
积 ,它们 都 与 神经 元 ) 相关 ,参看 式 (7-21)。 

@ 如 果 神 经 元 ) 是 隐藏 层 结 点 ,8 (2) 就 是 其 导数 yf; (vj(n)) 和 6 的 加 权 和 的 乘积 ,这 
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些 5 是 对 与 神经 元 ; 相连 的 下 一 个 隐藏 层 或 输出 层 中 的 神经 元 计算 得 到 的 ,参看 式 (7-31) 。 

下 面 给 出 反 向 传播 算法 的 实施 步骤 。 

(1) 计算 的 二 次 传播 。 

在 反 向 传播 算法 的 应 用 中 ,有 两 种 截然 不 同 的 传播 : 第 一 个 是 指 前 向 传播 ;第 二 个 是 
指 反 向 传播 。 

在 前 向 传播 中 ,在 通过 网 络 时 突 触 权 值 保持 不 变 , 而 网 络 的 函数 信号 在 一 个 神经 元 接 
一 个 神经 元 的 基础 上 计算 。 反 向 传播 从 输出 层 开 始 , 误 差 信 号 向 左 通 过 网 络 一 层 一 层 传 
播 ,并 且 递 归 计 算 每 一 个 神经 元 的 3( 即 局 部 梯度 )。 该 递归 过 程 允许 突 触 权 值 根据 
式 (7-32) 的 delta 规则 变化 。 对 于 位 于 输出 层 的 神经 元 ,6 简单 地 等 于 这 个 神经 元 的 误差 
信和 号 乘 以 它 的 非 线性 一 阶 导数 。 因 此 ,我 们 使 用 式 (7-32) 计 算 所 有 馈 人 输出 层 的 连接 权 
值 变化 。 给 出 输出 层 神经 元 的 8, 接 着 用 式 (7-31) 计 算 倒 数 第 二 层 的 所 有 神经 元 的 $ 和 
所 有 馈 人 该 层 的 连接 的 权 值 变化 。 通 过 传播 这 个 变化 给 网 络 的 所 有 突 触 权 值 , 一 层 接 一 
层 地 连续 递归 计算 。 

注意 ,由 于 每 给 出 一 个 训练 样本 ,其 输入 模式 在 整个 往返 过 程 中 都 是 固定 的 ,这 个 往 
返 过 程 包括 前 向 传播 和 随后 的 反 向 传播 。 

(2) 激活 函数 。 

计算 多 层 感知 器 每 一 个 神经 元 的 9 需要 关于 神经 元 的 激活 函数 %(。) 的 导数 知识 。 
要 导数 存在 , 则 需要 函数 pg(，) 连 续 , 并 满足 可 微 性 。 通 常用 于 多 层 感 知 器 的 连续 可 导 非 
线性 激活 函数 的 一 个 例子 是 sigmoid 非 线性 函数 。 这 里 有 两 种 形式 要 说 明 。 

OO logistic 函数 。 这 种 sigmoid 非 线 性 性 的 一 般 形式 由 


1 
PUM) TF a o>" <v < (7-33) 


定义 ,这 里 ,v(m) 是 神经 元 j 的 诱导 局 部 域 。 根 据 这 种 非 线 性 性 ,输出 的 范围 为 0<y; 三 1。 
对 式 (7-33) 取 v(m) 的 微分 ,得 到 





aexp(— avj(n)) 
[1+ exp(— av;(n)) 


由 于 yj (2) 二 gj (v(m)), 可 以 从 式 (7-34) 中 消去 指数 项 exp( 一 au (n)), 所 以 导数 
GY (vj(n)) 可 以 表示 为 


9 (vj(n)) = (7-34) 


Gi vj;n)) = ay; WL1— y;(n)] 《7-35》 
因为 神经 元 j 位 于 输出 层 , 所 以 yj(n) 二 0;(n)。 因 此 ,可 以 将 神经 元 j 的 局 域 梯度 表 
示 为 
01)= en vn)) 
= a[d;(n) —o;(n)Jo;(m[1—o;(n)] (7-36) 
这 里 的 0;(n) 是 神经 元 j 输出 端的 函数 信号 ,而 必 (z) 是 它 的 期 望 响应 。 另 外 ,对 任 
意 的 一 个 隐藏 层 神经 元 j, 都 可 以 将 局 域 梯度 表示 为 
= Yo) > Or ws (n) 
下 


三 ayjGD[1 一 yy (WD] >)6iGvrws ln) 7 为 隐藏 层 神经 元 (7-37) 
k 
从 式 (7-35) 可 以 看 出 ,导数 gj (v(m)) 当 yj (n) 二 0.5 时 取 最 大 值 , 当 yj(n) 二 0 或 


务 7 邯 加 加 ?3 有 5 

OOD 一 1 时 取 最 小 值 0。 既 然 网 络 的 一 个 突 触 权 值 的 变化 总 量 与 导数 gj (v(m)) 成 正比 , 因 
此 对 于 一 个 sigmoid 激活 函数 来 说 , 突 触 权 值 改 变 最 多 的 神经 元 是 那些 函数 信号 在 它们 的 中 
间 范 围 内 的 网 络 的 神经 元 。 正 是 反 向 传播 学 习 这 个 特点 导致 它 作为 学 习 算 法 的 稳定 性 。 

@ 双 曲 正切 函数 。 另 外 一 个 经 常 使 用 的 sigmoid 非 线性 形式 是 双 曲 正切 函数 , 它 的 
最 通用 的 形式 表示 为 

Givi(n)) = atanh(bvj;(n)) (a,b> 0) 
这 里 ,a 和 2 是 常数 。 事 实 上 , 双 曲 正切 函数 只 是 伸缩 和 平移 的 logistic 函数 。 它 对 vj (n) 
的 导数 如 下 。 
9 vin) =absech’ (bu; (n)) 
=ab (1 — tanh’ (bv;(n))) 


=2 [a — ,0 Jat ym] (7-38) 
如 果 隐 藏 层 神经 元 7 位 于 输出 层 , 则 它 的 局 域 梯度 是 
BC) =e;n) 9 (vn)) 
[dm oj (0)][a 一 oCn)][a 十 0;(n)] j 为 隐藏 层 神经 元 (7-39) 
如 果 神 经 元 j 位 于 隐藏 层 , 则 
6 = gv) > Or Dwy Co) 
4 








= LEa— yat 300 orwy Cm) (7-40) 
1 


对 式 (7-36) 和 式 (7-37) 用 logistic 函数 以 及 对 式 (7-39) 和 式 (7-40) 用 双 曲 正切 函 
数 , 不 需要 激活 函数 的 具体 信息 ,就 可 以 计算 局 域 梯度 6;。 

(3) 学 习 率 。 

反 向 传播 算法 使 用 最 速 下 降 法 在 权 空 间 的 计算 中 给 出 了 轨迹 的 一 种 近似 。 我 们 使 用 
的 学 习 率 参数 7 越 小 ,从 一 次 迭代 到 下 一 次 迭代 的 网 络 突 触 权 值 的 变化 量 就 越 小 ,轨迹 在 
权 空间 就 越 光滑 。 然 而 ,这 种 改进 是 以 减 慢 学 习 的 速度 为 代价 的 。 如 果 让 了 的 值 太 大 ,以 
加 快 学 习 速 度 , 结 果 就 有 可 能 使 网 络 的 突 触 权 值 的 变化 量 不 稳定 ( 即 振荡 )。 一 个 既 要 加 
快 学 习 速率 ,又 要 保持 稳定 的 简单 方法 是 要 修改 式 (7-20) 的 delta 规则 ,使 它 包 括 动量 
项 ,表示 为 

Awi(n) = aAwi (nC— 1)++;(n) y(n) (7-41) 

这 里 ,a 是 动量 常数 ,通常 是 正 数 。 它 控制 围绕 Arwj (nn) 反 馈 环 路 。 式 (7-41) 被 称 为 广义 
delta 规则 ; 它 包 括 式 (7-20) 的 delta 规则 作为 特殊 情况 ( 即 a==0)。 

在 反 向 传播 算法 中 ,动量 的 使 用 对 更 新 权 值 来 说 是 一 个 较 小 的 变化 ,而 它 对 算法 的 学 
习 可 能 会 有 一 些 有 利 的 影响 。 而 且 动量 项 对 于 使 学 习 过 程 不 停止 在 误差 曲面 上 一 个 浅 层 
的 局 部 最 小 可 能 也 有 益处 。 

在 导出 反 向 传播 算法 时 ,假设 学 习 率 参数 7 是 一 个 常数 。 然 而 ,事实 上 它 应 该 被 定义 
为 六 ;也 就 是 说 ,学 习 率 参数 应 该 是 依赖 连接 的 。 

(4) 训练 的 串 行 和 集中 方式 。 

在 反 向 传播 算法 的 实际 应 用 中 ,学习 结果 是 从 指定 的 训练 例子 多 次 呈现 给 多 层 感知 
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器 而 得 到 。 在 学 习 过 程 中 ,整个 训练 集 的 完全 呈现 称 为 一 个 回合 (epoch)。 学 习 过 程 是 在 
一 个 回合 接 一 个 回合 的 基础 上 进行 ,直到 网 络 的 突 触 权 值 和 误差 水 平稳 定 下 来 ,并 且 整 个 
训练 集 上 的 均 方 误差 收敛 于 某 个 极 小 值 。 从 一 个 回合 到 下 一 个 回合 时 ,将 训练 样本 的 呈 
现 顺序 随机 化 是 一 个 很 好 的 实践 。 这 种 随机 化 易于 在 学 习 循 环 中 使 得 权 空间 搜索 具有 随 
机 性 ,因此 可 以 在 突 触 权 向 量 演化 中 避免 极限 环 出 现 的 可 能 性 。 

对 于 一 个 给 定 的 训练 集 , 反 向 传播 学 习 可 能 会 以 下 面 两 种 基本 方式 之 一 进行 。 

@ 串 行 方式 。 反 向 传播 学 习 的 串 行 方式 也 被 认为 是 在 线 方式 或 随机 方式 。 在 这 种 
运行 方式 中 , 权 值 的 更 新 出 现在 每 个 训练 样本 呈现 之 后 ;这 正 是 导出 目前 反 向 传播 算法 公 
式 所 引用 的 运行 方式 。 具 体 地 ,考虑 包含 N 个 训练 样本 的 一 个 回合 ,其 顺序 是 (x(1)， 
d(1)),…,(CrCON),dCON))。 第 一 个 样本 (x(1),d(1)) 呈 现 给 网 络 时 ,完成 以 前 描述 的 前 向 
和 后 向 计算 ,导致 网 络 的 突 触 权 值 和 偏 置 水 平 的 一 定 调整 。 接 着 ,第 二 个 样本 (x(2)， 
d(2)) 呈 现时 ,重复 前 向 和 后 向 的 计算 ,导致 网 络 的 突 触 权 值 和 偏 置 水 平 的 进一步 调整 。 
直到 最 后 一 个 样本 (x(N),d(N)) 考 虑 完 以 后 ,这 个 过 程 才 结束 。 

@ 集中 方式 。 在 反 向 传播 学 习 的 集中 方式 中 , 权 值 更 新 要 在 组 成 一 个 回合 的 所 有 样 
本 呈现 后 才 进 行 。 对 于 特定 的 一 个 回合 ,我 们 将 代价 函数 定义 为 式 (7-9) 和 式 (7-10) 均 
方 误差 ,重新 写成 下 面 的 组 合 形式 : 

矶 ,三 赤 滨 Dei (7-42) 

这 里 ,误差 信号 w (nn) 表示 训练 样本 由 式 (7-8) 中 定义 的 输出 神经 元 7 有 关 的 误差 。 
误差 ej (nn) 等 于 dj(n) 和 yj(n) 的 差 ,它们 分 别 表示 期 望 响应 向 量 dm) 的 第 j 个 分 量 和 网 
络 输出 的 相应 的 值 。 在 式 (7-42) 中 ,关于 j 的 内 层 求 和 是 对 网 络 的 输出 层 的 所 有 神经 元 
进行 的 ,而 关于 的 外 层 求 和 是 对 当前 回合 的 整个 训练 集 进行 的 。 对 于 学 习 率 参数 7 应 
用 于 从 i 连接 到 j 的 wi 的 修正 值 由 delta 规则 定义 。 











9E, 
Mr —— 7 es 
二 9ej (n) 
一 一 卫 > ed A 
和 之 ei(n) 3 (7-43) 


要 计算 偏 导 数 9e;(n)/9rw; ,我 们 用 以 前 的 方式 处 理 。 根 据 式 (7-43) ,在 集中 方式 中 , 权 值 
的 修正 值 Awj (n) 是 在 整个 训练 集 提交 训练 以 后 才 决 定 的 。 

从 在 线 运行 的 观点 看 ,训练 的 串 行 方式 比 集中 方式 要 好 ,因为 对 每 一 个 突 触 权 值 来 
说 , 需 有 更 少 的 局 部 存储 。 而 且 , 既 然 以 随机 方式 给 定 网 络 的 训练 例子 ,利用 一 个 例子 接 
一 个 例子 的 方法 更 新 权 值 使 得 在 权 值 空间 的 搜索 自然 具有 随机 性 。 这 使 得 反 向 传播 算法 
要 达到 局 部 最 小 可 能 性 降低 了 。 

(5) 停止 准则 。 

通常 , 反 向 传播 算法 不 能 证 明 收敛 性 ,并 且 没 有 公认 的 好 准则 停止 其 运行 。 本 书 建议 
的 收敛 准则 : 

当 每 一 个 回合 的 均 方 误差 的 变化 的 绝对 速率 足够 小 时 ,认为 反 向 传播 算法 已 经 收敛 。 

均 方 误差 的 变化 的 绝对 速率 如 果 每 个 回合 都 为 0.1% 一 1% ,一 般 认为 它 足 够 小 。 有 
时 ,每 个 回合 都 会 用 到 小 到 0.01% 这 样 的 值 。 可 是 ,这 个 准则 可 能 会 导致 学 习 过 程 过 早 
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终止 。 有 另外 一 个 有 用 的 且 有 理论 支持 的 收敛 准则 : 在 每 一 个 学 习 和 迭 代 之 后 ,都 要 检查 
网 络 的 泛 化 性 能 , 当 泛 化 性 能 是 适当 的 ,或 泛 化 性 能 明显 达到 峰值 时 ,学 习 过 程 被 终止 。 


7.3.3 案例 : 基于 反 向 传播 网 络 拟 合 曲线 


使 用 S 形 非 线性 函数 的 反 向 传播 学 习 方 法 获得 对 如 下 函数 的 拟 合 。 
gp =1+sin(4p),—2<p<2, (7-44) 


要 求 : 建立 两 个 数据 集 ,一 个 用 于 网 络 训练 , 另 一 个 用 于 测试 ; @ 假 设 具 有 单个 隐 层 ， 
利用 训练 数据 集 计算 网 络 的 突 触 权重 ; @ 通 过 使 用 测试 数据 给 网 络 的 计算 精度 赋值 ; 
四 使 用 单个 隐 层 ,但 隐 含 神经 元 数目 可 变 , 研 究 网 络 性 能 是 如 何 受 隐 层 大 小 变化 影响 的 。 

解 : 下 面 选择 一 个 网 络 并 将 BP 算法 用 在 其 上 解决 一 个 特定 问题 。 假 定 用 此 网 络 通 
近 函 数 。 首 先 ,采用 1-2-1 网 络 ,如 图 7-20 所 示 。 用 1-2-1 BP 网 络 允 近 一 函数 如 图 7-21 
所 示 。 














g(p) = 1+ sin(¥p) 














图 7-20 1-2-1 网 络 示意 图 


输入 Log-Sigmoid 屋 线性 层 








al=logsig(W 'p+b') a=purelin( Wa'+b’) 
图 7-21 用 1-2-1 BP 网络 逼近 一 函数 


训练 集 可 以 通过 计算 函数 在 几 个 p 值 上 的 函数 值得 到 。 在 开始 BP 算法 前 ,需要 选 
择 网 络 权 值 和 偏 置 值 的 初始 值 。 通 常 选择 较 小 的 随机 值 。 
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一 0.27 一 0.48 
W'(0) = b'(0)= 
一 0.41 一 0.13 


W*(0) = [0.09 一 0.17] b*(0) = [0.48] (7-45) 
网 络 对 初始 权 值 的 响应 如 图 7-22 所 示 。 


3 





-一 Network Response 
一 Sine Wave 














- 演 -1 0 1 2 
图 7-22 网 络 对 初始 权 值 的 响应 


我 们 选择 一 1 
第 一 层 输出 : 
a =f'(Wia' tbh) = wesis| |- 本 4 jc+ | |]= ou 六 册 后 | 


1 |1e EE ol 
al 一 二 
0. 368 








1 本 再 e0.54 
第 二 层 输出 : 
0. 321 


2 = f(Wia! bb) = li cto.09—0.17]| 
a A a purelin ([ ls 68 


上 [0.48]) = [0. 446] 
误差 : 

e=1—a [tsin( 42)) a? {rsn(#)) 0.446 = 1. 261 
下 面 求 反 向 传播 敏感 性 值 。 先 求 传输 函数 的 导数 。 对 第 一 层 : 
Pln) 六 (| dy ( me se 
对 第 二 层 : 
































= 0 二 
执行 反 向 传播 。 起 始点 在 第 二 层 。 
== (=) == N26D ==Z111]((L. 2 ==2522 
第 一 层 敏 感性 由 计算 第 二 层 的 敏感 性 反 向 传播 得 到 。 
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(1—al)(al) 0 0.09 
= ws =—| To || | -2.522] 
0 (1—a})(a}) 1l—0.17 
人 二 0 2100S 0 0.09 
= [—2.522] 
0 (1—0.368)(0.368) | |—0.17 


_ fo.218 0 一 0.227] _ [—0.0495 
-| 0 ws 
更 新 权 值 。 学 习 速度 设 为 0.1, 即 一 0. 1。 
W2:(1) 一 W2:(0) 一 as2(aD)T7 一 [0.09 一 0.17] 一 0.1[ 一 2.522][0.321 0.368] 
= [0.171 一 0.0772] 
12(1) = b(0)—as* = [0.48] 一 0.1[ 一 2.522] = [0.732] 


一 0.27 一 0.0495 一 0.265 
W'(1) = Wi (0) —as! (a’)T 0.1 [1] = 
一 0.41 0. 0997 一 0.420 


一 0.48 一 0.0495 一 0.475 
hi) 一 中 (0) 一 at | Fo 上 | | 
一 0.13 0. 0997 一 0. 140 
这 就 完成 了 BP 算法 的 第 一 次 迭代 。 下 一 步 可 以 选择 另 一 个 输入 pp ,执行 算法 的 第 二 
次 迭代 过 程 。 和 迭代 过 程 一 直 进 行 下 去 ,直到 网 络 响应 和 目标 函数 之 差 达 到 某 一 可 接受 的 
水 平 。 
关于 体系 结构 的 选择 ,考察 如 下 函数 的 拟 合 问题 : 


g(p) 一 1+sin( 至 p] 其 中 一 2 三 p 过 2 


如 果 选 择 1-3-1 网 络 结构 , 即 隐 含 神经 元 数目 为 3,i 分 别 等 于 1、2、4 时 拟 合 效 果 较 
好 ,i 等 于 8 时 拟 合 效果 较 差 , 如 图 7-23 所 示 。 













































































3 3 

2 2 

| 一 ~ 

0 0 

-1 -1 

二 -1 0 1 2 2 =- 0 1 2 
(a) 天 1 (b) =2 

3 3 

名 2 

(\/ Vy 

0 0 

一 0 1 2 本 0 1 2 
(©) i=4 (d) i8 


图 7-23 i 分 别 等 于 1.2、4、8 时 的 1-3-1 网 络 拟 合 效果 


使 用 单个 隐 层 ,但 隐 含 神经 元 数目 可 变 ,通过 实例 分 析 网 络 性 能 是 如 何 受 隐 层 大 小 变 
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化 影响 的 。 给 定 如 下 函数 ,1-2-1,1-3-1,1-4-1,1-5-1 网 络 拟 合 效果 如 图 7-24 所 示 , 只 
有 1-5-1 网 络 体系 结构 的 拟 合 效果 达到 要 求 。 


g(p) 1+sin (名) 其 中 一 2 亏 p 二 2 












































3 3 
2 3 
HAS 1 
0 0 
了 一 了 0 1 2 了 0 1 2 
(a) 1-2-1 (b) 1-3-1 
3 3 
2 2 
0 0 
-1 -1 
-2 = 0 1 2 | 0 1 2 
(©) 1-4-1 (d) 1-5-1 


图 7-24 1-2-1,1-3-1,1-4-1,1-5-1 网 络 拟 合 效果 


使 用 单个 隐 层 ,1-n-1 网 络 拟 合 效果 均 达 到 要 求 的 情况 下 ,选择 隐 含 神经 元 数目 较 小 的 
网 络 , 泛 化 能 力 较 好 。 例 如 ,考虑 如 下 函数 及 训练 样本 ,1-2-1 网 络 泛 化 效果 较 好 (图 7-25)， 
1-9-1 网 络 泛 化 效果 较 差 (图 7-26)。 


g(p) 1+sin(#p] p=—2,—1.6,—1.2,.,1.6,2 











{pisti}, {pz te}, {posto} 











3 3 
| 
2| 一 一 2| A 
| /> 
ee > 
We | 。 一 一 
| 
二 村 0 i 2 落 加] 0 i 2 
图 7-25 1-2-1 网 络 泛 化 效果 较 好 图 7-26 1-9-1 网 络 泛 化 效果 较 差 


下 面 给 出 采用 BP 网 络 拟 合 样本 点 (图 7-27) 的 程序 、 拟 合 过 程 (图 7-28 一 图 7-30) 及 
收敛 曲线 (图 7-31 和 图 7-32) 。 





名 
clf reset 


figure (gcf) 


$ setfsize (500,200); 
echo on 

clc 

sinitff--- 对 前 向 网 络 进行 初始 化 
strainbpx--- 用 算法 对 前 向 网 络 进行 训练 
ssimuff--- 对 前 向 网 络 进行 仿真 

pause 

clc 


E=-1:.1:17 


t= [- .9602 - .5770 - .0729 .3771 .6405 .6600 .4609 .1336 - .2013 - .4344 - .5000 ... 


=- .3930 - .1647 .0988 .3072 .3960 .3449 .1816 - .0312 - .2189 - .3201]; 


pause 
clc 
biot bit + 
title('training vectors'); 
xlabel ('input vector p'); 
ylabel ('target vector t'); 
pause 
clc 
sl=5; 
[wl,bl,w2,b2]=initff (p, sl, 'tansig',t, 'purelin'); 
echo off 
k=pickic; 
if k==2 
Wl= [3.5000;3.5000;3.5000;3.5000;3.5000]; 
bl= [- 2.8562;1.0744;0.5880;1.4083;2.8722]; 
W2= [0.2622 - .2375 - .4525 .2361 - .1718]; 





2= [.1326] 
end 
echo on 
clc 
df=10; 学 习 过 程 显示 频率 


me= 8000; s 最 大 训练 步 数 
eg= 0.02; s 误 差 指 标 
1r=0.01; s 学 习 率 

tp= [df me eg 1r] 


[wl,bl,w2,b2,ep,tr]=trainbp (wl,bl, 'tansig',w2,b2, 'purelin',p,t,tp); 


pause 
clc 

ploterr (trveg) 7 

pause 

clc 

EP=0.5; 

a= simuff (p,wl,bl, 'tansig',w2,b2, 'purelin') 
echo off 
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图 7-27 样本 点 





7-29 ” 拟 合 过 程 (二 ) 
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图 7-30 拟 合 过 程 ( 三 ) 





图 7-31 收敛 曲线 (5566 回合 时 ) 





图 7-32 改进 算法 的 收敛 曲线 (938 回合 时 ) 
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7.3.4 深度 学 习 


深度 学 习 是 机 器 学 习 研 究 的 一 个 新 方向 , 源 于 对 人 工 神经 网 络 的 进一步 研究 ,通常 采 
用 包含 多 个 隐 层 的 深层 神经 网 络 结构 。 

深度 学 习 算 法 是 一 类 基于 生物 学 对 人 脑 进一步 认识 ,将 神经 -中 枢 - 大 脑 的 工作 原理 
设计 成 一 个 不 断 迭 代 、 不 断 抽象 的 过 程 ,以 便 得 到 最 优 数据 特征 表示 的 机 器 学 习 算法 ;该 
算法 从 原始 信号 开始 , 先 做 低层 抽象 ,然后 逐渐 向 高 层 抽象 欠 代 ,由 此 组 成 深度 学 习 算 法 
的 基本 框架 。 

1. 深度 学 习 概 述 

深度 学 习 是 一 类 基于 神经 网 络 的 机 器 学 习 算 法 ,网 络 结构 包含 两 个 以 上 非 线 性 隐 层 。 
目前 ,一 些 常 用 的 网 络 结构 包括 深度 信念 网 络 (Deep Belief Networks,DBN) \ 深 度 玻 尔 兹 
曼 机 (Deep Boltzmann Machine, DBM)、 自 编码 器 (AutoEncoder, AE)、 卷 积 神经 网 络 
(Convolutional Neural Network, CNN) .递归 神经 网 络 (Recurrent Neural Networks， 
RNN) 等 。 

DBN 是 第 一 批 成 功 应 用 深度 学 习 架 构 训 练 模型 之 一 , 它 也 因 Hinton 在 2006 年 的 相 
关 论 文 而 成 为 深度 学 习 凯 起 的 代表 。Hinton 用 它 向 人 们 展示 了 我 们 可 以 通过 逐 层 设 定 
目标 、 逐 层 训练 而 构造 出 一 个 深层 的 神经 网 络 , 并 且 用 它 有 效 地 解决 一 些 问题 。DBN 是 
由 多 个 受 限 RBM 相 邻 彼此 重生 一 层级 联 而 成 为 一 个 “深度 ”网 络 。 每 一 个 RBM 都 采用 
无 监督 学 习 。 与 卷 积 网 络 层 间 部 分 连接 不 同 , 深 度 信念 网 络 是 层 间 全 连接 的 。 一 个 训练 
好 的 DBN 可 以 作为 一 个 概率 生成 网 络 使 用 ,也 可 以 用 来 为 分 类 网 络 做 参数 的 初始 化 优 
化 设置 ,有 效 改善 分 类 网 络 的 学 习 效果 。 随 着 其 他 无 监督 学 习 及 生成 学 习 算法 的 发 展 , 深 
度 信念 网 络 已 经 较 少 被 使 用 了 。 

深度 神经 网 络 能 够 为 复杂 非 线性 系统 提供 建 模 , 但 多 出 的 层次 为 模型 提供 了 更 高 的 
抽象 层次 ,因而 提高 了 模型 的 能 力 。 鉴 于 深度 学 习 对 大 数据 处 理 的 有 效 性 ,许多 著名 大 学 
都 有 学 者 在 从 事 深 度 学 习 的 理论 研究 ,许多 知名 公司 也 投入 了 大 量 的 资源 研发 深度 学 习 
应 用 技术 。 在 数据 和 计算 资源 足够 的 情况 下 ,深度 学 习 在 语音 识别 、 视 觉 对 象 识别 .自然 
语言 处 理 等 领域 体现 出 占据 支配 地 位 的 性 能 表现 。 

一 般 来 说 ,深度 学 习 算 法 具有 如 下 特点 。 

(1) 使 用 多 重 非 线 性 变换 对 数据 进行 多 层 抽象 。 该 类 算法 采用 级 联 模式 的 多 层 非 线 
性 处 理 单元 组 织 特征 提取 以 及 特征 转换 。 在 这 种 级 联 模型 中 ,后 继 层 的 数据 输入 由 其 前 
一 层 的 输出 数据 充当 。 按 学 习 类 型 ,该 类 算法 又 可 归 为 有 监督 学 习 ( 如 分 类 ) 或 无 监督 学 
习 ( 如 模式 分 析 ) 。 

(2) 以 寻求 更 适合 的 概念 表示 方法 为 目标 。 这 类 算法 通过 建立 更 好 的 模型 学 习 数 据 
表示 方法 。 对 于 学 习 所 用 的 概念 特征 值 或 者 说 数据 的 表示 ,一 般 采用 多 层 结构 进行 组 织 ， 
这 也 是 该 类 算法 的 一 个 特色 。 高 层 的 特征 值 由 低层 特征 值 通过 推演 归纳 得 到 ,由 此 组 成 
了 一 个 层次 分 明 的 数据 特征 或 者 抽象 概念 的 表示 结构 ;在 这 种 特征 值 的 层次 结构 中 ,每 一 
层 的 特征 数据 对 应 着 相关 整体 知识 或 者 概念 在 不 同 程度 或 层次 上 的 抽象 。 

(3) 形成 一 类 具有 代表 性 的 特征 表示 学 习 方 法 。 在 大 规模 无 标识 的 数据 背景 下 ,一 
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个 观测 值 可 以 使 用 多 种 方式 表示 ,如 一 幅 图 像 、 人 脸 识 别 数据 、 面 部 表情 数据 等 ,而 某 些 特 
定 的 表示 方法 可 以 让 机 器 学 习 算 法 学 习 起 来 更 加 容易 。 所 以 ,深度 学 习 算 法 的 研究 也 可 
以 看 作 是 在 概念 表示 基础 上 ,对 更 广泛 的 机 器 学 习 方法 的 研究 。 深 度 学 习 一 个 很 突出 的 
前 景 便 是 它 使 用 无 监督 的 或 者 半 监 督 的 特征 学 习 方 法 ,加 上 层次 性 的 特征 提取 策略 , 蔡 代 
过 去 手工 方式 的 特征 提取 。 

Geoffrey Hinton 提出 了 两 个 观点 : 多 隐 层 的 人 工 神 经 网 络 具 有 非常 突出 的 特征 
学 习 能 力 。 如 果 用 机 器 学 习 算法 得 到 的 特征 刻画 数据 ,可 以 更 加 深层 次 地 描述 数据 的 本 
质 特征 ,在 可 视 化 或 分 类 应 用 中 非常 有 效 。@ 深 度 神经 网 络 在 训练 上 存在 一 定 难度 ,但 这 
些 可 以 通过 “ 逐 层 预 训练 "有 效 克 服 。 

下 面 介绍 卷 积 神经 网 络 基 本 原理 ,7. 3. 5 节 介 绍 其 具体 应 用 。 

2. 卷 积 神经 网 络 

卷 积 神经 网 络 (CNN) 本 质 上 是 一 种 输入 到 输出 的 映射 , 它 可 以 减少 图 像 的 位 置 变化 
带 来 的 不 确定 性 ,所 以 它 对 图 像 的 识别 能 力 非常 强 。1984 年 ,日 本 学 者 Fukushima 基于 
感受 野 概 念 提出 神经 认 知 机 ,这 是 卷 积 神经 网 络 的 第 一 个 实现 网 络 , 也 是 感受 野 概 念 在 人 
工 神经 网 络 领域 的 首次 应 用 。 受 视觉 系统 结构 的 启示 , 当 具 有 相同 参数 的 神经 元 应 用 前 
一 层 的 不 同位 置 时 ,就 可 以 获取 一 种 变换 不 变性 特征 。LeCun 等 人 根据 这 个 思想 ,利用 
反 向 传播 算法 设计 并 训练 了 CNN。CNN 是 一 种 特殊 的 深层 神经 网 络 模型 ,其 特殊 性 主 
要 体现 在 两 个 方面 : 一 是 它 的 神经 元 间 的 连接 是 非 全 连接 的 ;二 是 同一 层 中 神经 元 之 间 
的 连接 采用 权 值 共享 的 方式 。 

1) 卷 积 层 

输入 图 像 通常 维 数 很 高 ,例如 ,1000X1000 大 小 的 彩色 图 像 对 应 于 300 万 维特 征 。 
因此 ,继续 沿用 多 层 感 知 机 中 的 全 连接 层 会 导致 庞大 的 参数 量 。 大 参数 量 需要 繁重 的 计 
算 , 更 重要 的 是 ,大 参数 量 会 有 更 高 的 过 拟 合 风险 。 卷 积 是 局 部 连接 、 共 享 参数 版 的 全 连 
接 层 。 这 两 个 特性 使 参数 量 大 大 降低 。 卷 积 层 中 的 权 值 通常 被 称 为 滤波 器 (filter) 或 卷 
积 核 (convolution kernel) ,如 图 7-33 所 示 。 





图 7-33 卷 积 层 


卷 积 层 设 计 原 则 及 其 注意 事项 如 下 。 
局 部 连接 。 在 全 连接 层 中 ,每 个 输出 通过 权 值 和 所 有 输入 相连 。 而 在 视觉 识别 中 , 关 
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键 性 的 图 像 特征 .边缘 、 角 点 等 只 占据 了 整 张 图 像 的 一 小 部 分 ,图 像 中 相距 很 远 的 两 个 像 
素 之 间 相 互 影响 的 可 能 性 很 小 。 因 此 ,在 卷 积 层 中 ,每 个 输出 神经 元 在 通道 方向 保持 全 连 
接 , 而 在 空间 方向 上 只 和 一 小 部 分 输入 神经 元 相连 。 

共享 参数 。 如 果 一 组 权 值 可 以 在 图 像 中 某 个 区 域 提取 出 有 效 的 表示 ,那么 它们 也 能 
在 图 像 的 男 外 区 域 中 提取 出 有 效 的 表示 。 也 就 是 说 ,如 果 一 个 模式 (pattern) 出 现在 图 像 
中 的 某 个 区 域 ,那么 它们 也 可 以 出 现在 图 像 中 的 其 他 任何 区 域 。 因 此 , 卷 积 层 不 同 空间 位 
置 的 神经 元 共享 权 值 ,用 于 发 现 图 像 中 不 同 空间 位 置 的 模式 。 共 享 参 数 是 深度 学 习 的 一 
个 重要 思想 ,其 在 减少 网 络 参 数 的 同时 仍然 能 保持 很 高 的 网 络 容 量 (capacity)。 卷 积 层 在 
空间 方向 共享 参数 ,而 递归 神经 网 络 (recurrent neural networks) 在 时 间 方 向 共享 参数 。 

卷 积 层 的 作用 。 通 过 卷 积 ,可 以 捕获 图 像 的 局 部 信息 。 通 过 多 层 卷 积 层 堆 释 ,各 层 提 
取 到 的 特征 逐渐 由 边缘 、 纹 理 、 方 向 等 低层 级 特征 过 渡 到 文字 、 车 轮 、 人 脸 等 高 层级 特征 。 
卷 积 层 中 的 卷 积 实质 是 输入 和 权 值 的 互相 关 (cross-correlation) 函数 。 

描述 卷 积 的 4 个 量 。 一 个 卷 积 层 的 配置 由 如 下 4 个 量 确定 。@D 滤 波 器 个 数 。 使 用 一 
个 滤波 器 对 输入 进行 卷 积 会 得 到 一 个 二 维 的 特征 图 (feature map)。 可 以 使 用 多 个 滤波 
器 对 输入 进行 卷 积 , 以 得 到 多 个 特征 图 。 加 感受 野 (Creceptive field) F, 即 滤波 器 空间 局 部 
连接 大 小 。 四 零 填 补 (zero-padding)P。 随 着 卷 积 的 进行 ,图 像 大 小 将 缩小 ,图 像 边 缘 的 
信息 将 逐渐 丢失 。 因 此 ,在 卷 积 前 ,在 图 像 上 、 下 \ 左 \ 右 填补 一 些 0, 使 得 我 们 可 以 控制 输 
出 特征 图 的 大 小 。 田 步 长 (stride)S。 滤 波 器 在 输入 每 移动 S 个 位 置 计 算 一 个 输出 神 
经 元 。 

卷 积 输入 输出 的 大 小 关系 。 假 设 输入 的 高 和 宽 为 也 和 W, 输 出 的 高 和 宽 为 H’ 和 
W', 则 HH'=(H 一 F 十 2P)/S 二 1, W'==(W 一 F 十 2P)/S 十 1。 当 S=1 时 ,通过 设 定 P= 
《F 一 1)/2, 可 以 保证 输入 输出 空间 大 小 相同 。 例 如 ,3X3 的 卷 积 需要 填补 一 个 像素 ,使 
得 输入 输出 空间 大 小 不 变 。 

应 该 使 用 多 大 的 滤波 器 。 尽 量 使 用 小 的 滤波 器 ,如 3X3 卷 积 。 通 过 堆 释 多 层 3X3 
卷 积 , 可 以 取得 与 大 滤波 器 相同 的 感受 野 。 例 如 ,三 层 3X3 卷 积 等 效 于 一 层 7X7 卷 积 的 
感受 野 。 但 使 用 小 滤波 器 有 以 下 两 点 好 处 。 中 更 少 的 参数 量 。 假 设 通 道 数 为 D, 三 层 
3X3 卷 积 的 参数 量 为 3X CDXDX3X3) 王 27D:, 而 一 层 7X7 卷 积 的 参数 量 为 DXDX 
7X7 二 49D? 。@ 更 多 非 线 性 。 由 于 每 层 卷 积 层 后 都 有 非 线 性 激活 函数 ,所 以 三 层 3X3 
卷 积 一 共 经 过 三 次 非 线性 激活 函数 ,而 一 层 7X7 卷 积 只 经 过 一 次 。 

1X1 卷 积 。 旨 在 对 每 个 空间 位 置 的 也 维 向 量 做 一 个 相同 的 线性 变换 ,通常 用 于 增加 
非 线性 ,或 降 维 ,这 相当 于 在 通道 数 方向 上 进行 了 压缩 。1X1 卷 积 是 减少 网 络 计算 量 和 
参数 的 重要 方式 。 

全 连接 层 的 卷 积 层 等 效 。 由 于 全 连接 层 和 卷 积 层 都 是 做 点 乘 , 这 两 种 操作 可 以 相互 
等 效 。 全 连接 层 的 卷 积 层 等 效 只 需要 设 定好 卷 积 层 的 4 个 量 : 滤波 器 个 数 等 于 原 全 连接 
层 输 出 神经 元 个 数 ,感受 野 等 于 输入 的 空间 大 小 ,没有 零 填 补 , 步 长 为 1。 

为 什么 要 将 全 连接 层 等 效 为 卷 积 层 ? 全 连接 层 只 能 处 理 固定 大 小 的 输入 ,而 卷 积 
层 可 以 处 理 任 意 大 小 的 输入 。 假 设 训练 图 像 的 大 小 是 224 像素 X224 像素 , 当 测 试图 
像 的 大 小 是 256 像素 X256 像素 时 ,如 果 不 进 行 全 连接 层 的 卷 积 层 等 效 ,我 们 就 需要 从 
测试 图 像 中 裁剪 出 多 个 224X224 区 域 分 别 前 馈 网 络 。 而 进行 卷 积 层 等 效 后 ,我 们 只 





务 7 葛 如 器 学 习 一 人 351 
将 256X256 输入 前 馈 网 络 一 次 , 即 可 达到 多 次 前 馈 224 X224 区域 的 效果 。 

卷 积 结果 的 两 种 视角 。 卷 积 结果 是 一 个 DX 有 电 XW 的 三 维 张 量 。 其 可 以 被 认为 是 
有 D 个 通道 ,每 个 通道 是 一 个 二 维 的 特征 图 ,从 输入 中 捕获 了 某 种 特定 的 特征 。 其 也 可 
以 被 认为 是 及 XW 个 空间 位 置 ,每 个 空间 位 置 是 一 个 D 维 的 描述 向 量 ,描述 了 对 应 感 
受 野 的 图 像 局 部 区 域 的 语义 特征 。 

卷 积 结果 的 分 布 式 表示 。 卷 积 结果 的 各 通道 之 间 不 是 独立 的 。 卷 积 结果 的 各 通道 的 
神经 元 和 语义 概念 之 间 是 一 个 “多 对 多 ”的 映射 , 即 每 个 语义 概念 由 多 个 通道 神经 元 一 起 
表示 ,而 每 个 神经 元 又 同时 参与 到 多 个 语义 概念 中 去 。 并 且 , 神 经 元 响应 是 稀疏 的 , 即 大 
部 分 的 神经 元 输出 都 为 0。 

卷 积 操作 的 实现 。 有 如 下 几 种 基本 思路 。@D 快 速 傅 里 叶 变 换 (FFT) 。 通 过 变换 到 频 
域 , 卷 积 运算 将 变 为 普通 和 矩阵 乘法 。 实 际 中 , 当 滤 波 器 尺寸 大 时 效果 好 ,而 对 于 通常 使 用 
的 1X1 和 3X3 卷 积 ,加 速 不 明显 。@im2col(image to column) 。im2col 将 与 每 个 输出 
神经 元 相连 的 局 部 输入 区 域 展 成 一 个 列 向 量 , 并 将 所 有 得 到 的 向 量 拼 接 成 一 个 矩阵 。 这 
样 , 卷 积 运算 可 以 用 矩阵 乘法 实现 。im2col 的 优点 是 可 以 利用 矩阵 乘法 的 高 效 实现 ,而 
弊端 是 会 占用 很 大 存储 空间 ,因为 输入 元 素 会 在 生成 的 矩阵 中 多 次 出 现 。 此 外 ,Strassen 
矩阵 乘法 和 Winograd 也 常 被 使 用 。 现 有 的 计算 库 如 MKL 和 cuDNN ,会 根据 滤波 器 的 
大 小 选择 合适 的 算法 。 

2) 池 化 层 

根据 特征 图 上 的 局 部 统计 信息 进行 下 采样 ,在 保留 有 用 信息 的 同时 ,减少 特征 图 的 大 
小 。 和 卷 积 层 不 同 的 是 , 池 化 层 不 包含 需要 学 习 的 参数 。 最 大 池 化 (max-pooling) 在 一 个 
局 部 区 域 选 最 大 值 作 为 输出 ,而 平均 池 化 (average pooling) 计 算 一 个 局 部 区 域 的 均值 作 
为 输出 。 局 部 区 域 池 化 中 最 大 池 化 使 用 更 多 ,而 全 局 平均 池 化 (global average pooling) 
是 更 常用 的 全 局 池 化 方法 ,如 图 7-34 所 示 。 


2x2 pooling, stride 2 


5 3 
了 ”> 图 国 : 
[| 


(a) 池 化 (b) 最 大 池 化 。 (6) 全 局 平均 池 化 
图 7-34 池 化 .最 大 池 化 和 全 局 平均 池 化 





池 化 层 主要 有 以 下 3 个 作用 : 增加 特征 平移 不 变性 。 池 化 可 以 提高 网 络 对 微小 位 
移 的 容忍 能 力 。@ 减 小 特征 图 大 小 。 池 化 层 对 空间 局 部 区 域 进行 下 采样 ,使 下 一 层 需要 
的 参数 量 和 计算 量 减 少 ,并 降低 过 拟 合 风险 。 加 最 大 池 化 可 以 带 来 非 线性 。 这 是 目前 最 
大 池 化 更 常用 的 原因 之 一 。 近 年 来 .有 人 使 用 步 长 为 2 的 卷 积 层 代替 池 化 层 。 而 在 生成 
式 模 型 中 ,有 研究 发 现 ,不 使 用 池 化 层 会 使 网 络 更 容易 训练 。 

3) 卷 积 神经 网 络 结构 

CNN 的 基本 结构 包括 两 层 , 即 特征 提取 层 和 特征 映射 层 。 特 征 提 取 层 中 ,每 个 神经 
元 的 输入 与 前 一 层 的 局 部 接受 域 相连 ,并 提取 该 局 部 的 特征 。 一 旦 该 局 部 特征 被 提取 后 ， 
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它 与 其 他 特征 间 的 位 置 关系 也 随 之 确定 下 来 ;每 一 个 特征 提取 层 后 都 紧 跟 着 一 个 计算 层 ， 
对 局 部 特征 求 加 权 平 均值 与 二 次 提取 ,这 种 特有 的 两 次 特征 提取 结构 使 网 络 对 平移 、 比 例 
缩放 ,倾斜 或 者 其 他 形式 的 变形 具有 高 度 不 变性 。 计 算 层 由 多 个 特征 映射 组 成 ,每 个 特征 
映射 是 一 个 平面 ,平面 上 采用 权 值 共享 技术 ,大 大 减少 了 网 络 的 训练 参数 ,使 神经 网 络 的 
结构 变 得 更 简单 ,适应 性 更 强 。 另 外 ,图 像 可 以 直接 作为 网 络 的 输入 ,因此 它 需 要 的 预 处 
理工 作 非 常 少 ,避免 了 传统 识别 算法 中 复杂 的 特征 提取 和 数据 重建 过 程 。 特 征 映 射 结 构 
采用 影响 函数 核 小 的 sigmoid 函数 作为 卷 积 网 络 的 激活 函数 ,使 得 特征 映射 具有 位 移 不 
变性 。 

并 且 ,在 很 多 情况 下 ,有 标签 的 数据 是 很 稀少 的 ,但 正如 前 面 所 述 , 作 为 神经 网 络 的 一 
个 典型 , 卷 积 神经 网 络 也 存在 局 部 性 、 层 次 深 等 深度 网 络 具 有 的 特点 。 卷 积 神经 网 络 的 结 
构 使 得 其 处 理 过 的 数据 中 有 较 强 的 局 部 性 和 位 移 不 变性 。Ranzato 等 人 将 卷 积 神经 网 络 
和 逐 层 贪 禁 无 监督 学 习 算法 相 结合 ,提出 了 一 种 无 监督 的 层次 特征 提取 方法 。 此 方法 用 
于 图 像 特 征 提取 时 效果 明显 。 基 于 此 CNN 被 广泛 应 用 于 人 脸 检测 .文献 识别 .手写 字体 
识别 ,语音 检测 等 领域 。 

3. 深度 学 习 的 优点 

深度 学 习 具 有 如 下 优点 。 

(1) 采用 非 线性 处 理 单元 组 成 的 多 层 结构 ,使 得 概念 提取 可 以 由 简单 到 复杂 。 

(2) 每 一 层 中 非 线性 处 理 单元 的 构成 方式 取决 于 要 解决 的 问题 ;同时 ,每 一 层 学 习 模 
式 可 以 按 需 求 调整 为 有 监督 学 习 或 无 监督 学 习 。 这 样 的 架构 非常 灵活 ,有 利于 根据 实际 
需要 调整 学 习 策略 ,从 而 提高 学 习 效率 。 

(3) 学 习 无 标签 数据 优势 明显 。 不 少 深度 学 习 算法 通常 采用 无 监督 学 习 形式 处 理 其 
他 算法 很 难处 理 的 无 标签 数据 。 现 实生 活 中 ,无 标签 数据 比 有 标签 数据 更 普遍 。 因 此 , 深 
度 学 习 算 法 在 这 方面 的 突出 表现 ,更 凸显 出 其 实用 价值 。 

传统 的 方法 是 通过 大 量 的 工程 技术 和 专业 领域 知识 手工 设计 特征 提取 器 ,因此 在 处 
理 未 加 工 数据 时 表现 出 的 能 力 有 限 ; 另 外 ,多 数 的 分 类 等 学 习 模型 都 是 浅 层 结构 ,制约 了 
对 复杂 分 类 问题 的 泛 化 能 力 。 

深度 学 习作 为 一 种 特征 学 习 方法 ,把 原始 数据 通过 一 系列 非 线 性 变换 得 到 更 高 层次 、 
更 加 抽象 的 表达 ,这 些 都 不 是 通过 人 工 设 计 , 而 是 使 用 一 种 通用 的 学 习 过 程 从 数据 中 学 习 
获得 。 深 度 学 习 主要 通过 建立 类 似 于 人 脑 的 分 层 模型 结构 ,对 输入 数据 逐 级 提取 从 低层 
到 高 层 的 特征 ,从 而 能 很 好 地 建立 从 低层 信号 到 高 层 语义 的 映射 关系 。 相 比 传统 的 方法 ， 
具有 多 个 处 理 层 的 深度 学 习 模型 能 够 学 习 多 层次 抽象 的 数据 表示 ,也 受益 于 计算 能 力 和 
数据 量 的 增加 ,从 而 能 够 发 现 大 数据 中 的 复杂 结构 ,在 语音 识别 、 图 像 分 类 等 领域 取得 了 
最 好 结果 ,同样 也 成 功 应 用 于 许多 其 他 领域 ,包括 预测 DNA 突变 对 基因 表达 和 疾病 的 影 
响 、 预 测 药物 分 子 活性 、 重 建 大 脑 回 路 等 。 其 中 ,深度 卷 积 神经 网 络 在 处 理 图 像 、 视 频 、 语 
音 和 音频 方面 表现 出 优异 的 性 能 ,这 是 一 种 前 馈 式 神经 网 络 ,更 易于 训练 ,并 且 比 全 连接 
的 神经 网 络 泛 化 性 能 更 优 。 

自 20 世纪 90 年 代 以 来 , 卷 积 神经 网 络 被 成 功 应 用 于 检测 、 分 割 . 识 别 . 语 音 、 图 像 等 
各 个 领域 。 例 如 ,最 早 是 用 时 延 神经 网 络 进行 语音 识别 以 及 文档 阅读 ,由 一 个 卷 积 神经 网 
络 和 一 个 关于 语言 约束 的 概率 模型 组 成 .这 个 系统 后 来 被 应 用 在 美国 超过 百 分 之 十 的 支 
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票 阅读 上 ;再 如 ,微软 开发 的 基于 卷 积 神经 网 络 的 字符 识别 系统 以 及 手写 体 识别 系统 ; 近 
年 来 , 卷 积 神经 网 络 的 一 个 重大 成 功 应 用 是 人 脸 识别 。Mobileye 和 NVIDIA 公司 也 正 试 
图 把 基于 卷 积 神经 网 络 的 模型 应 用 于 汽车 的 视觉 辅助 驾驶 系统 中 。 如 今 , 卷 积 神经 网 络 
用 于 几乎 全 部 的 识别 和 检测 任务 ,最 近 一 个 有 趣 的 成 果 就 是 利用 卷 积 神经 网 络 生成 图 像 
标题 。 也 正 是 因为 卷 积 神经 网 络 易于 在 芯片 上 高 效 实现 ,许多 公司 如 NVIDIA、 
Mobileye、Intel、Qualcomm 以 及 Samsung 积极 开发 卷 积 神经 网 络 芯片 ,以 便 在 智能 手 
机 、 相 机 、 机 器 人 以 及 自动 驾驶 汽车 中 实现 实时 视觉 系统 。 

深度 学 习 已 经 成 功 应 用 于 各 种 领域 。 例 如 ,在 计算 机 视觉 领域 ,深度 学 习 已 成 功用 于 
处 理 包 含有 上 千 万 图 片 的 ImageNet 数据 集 。 在 语音 识别 领域 ,微软 研究 人 员 通 过 与 
Hinton 合作 ,首先 将 深度 学 习 模 型 RBM 和 DBN 引入 到 语音 识别 声学 模型 训练 中 ,并 且 
在 大 词汇 量 语音 识别 系统 中 获得 巨大 成 功 ,使 得 语音 识别 的 错误 率 相对 降低 30%。 在 自 
然 语 言 处 理 领域 ,采用 深度 学 习 构 建 的 模型 能 够 更 好 地 表达 语法 信息 。 递 归 神 经 网 络 
(RNN) 可 以 模拟 动态 的 时 间 序 列 ,把 过 去 的 输出 作为 下 一 时 间 的 输入 ,这 样 可 以 描述 动 





7.3.5 案例 : 深度 学 习 在 计算 机 视觉 中 的 应 用 


视觉 是 人 类 获取 信息 的 最 主要 方式 。 在 视觉 .听觉 .嗅觉 .触觉 和 味觉 中 ,视觉 接受 信 
息 的 比例 约 占 80%。 计 算 机 视觉 (computer vision) 旨 在 识别 和 理解 图 像 /视频 中 的 内 容 。 
其 诞生 于 1966 年 MIT AI Group 的 ihe summer vision project。 如 今 ,互联 网 上 超过 
70 凶 的 数据 是 图 像 /视频 ,全 世界 的 监控 摄像 头 数目 已 超过 人 口 数 ,每 天 有 超过 八 亿 小 时 
的 监控 视频 数据 生成 。 如 此 大 的 数据 量 或 待 自动 化 的 视觉 理解 与 分 析 技 术 。 

1. 计算 机 视觉 概述 

计算 机 视觉 的 难点 在 于 语义 鸿沟 。 这 个 现象 不 仅 出 现在 计算 机 视觉 领域 , Moravec 
悖 论 发 现 , 高 级 的 推理 只 需要 非常 少 的 计算 资源 ,而 低级 的 对 外 界 的 感知 却 需 要 极 大 的 计 
算 资源 。 要 让 计算 机 如 成 人 般 地 下 棋 是 相对 容易 的 ,但 是 要 让 计算 机 有 如 一 岁 小 孩 般 的 
感知 和 行动 能 力 却 是 相当 困难 ,甚至 是 不 可 能 的 。 

语义 鸿沟 (semantic gap) ,是 指 人 类 可 以 轻松 地 从 图 像 中 识别 出 目标 ,而 计算 机 看 到 
的 图 像 只 是 一 组 0 一 255 的 整数 。 计 算 机 视觉 任务 的 其 他 困难 包括 : 拍摄 视角 变化 、 目 标 
占据 图 像 的 比例 变化 ,光照 变化 ,背景 融合 、 目 标 形变 、 遮 挡 等 。 

对 于 计算 机 视觉 系统 而 言 ,输入 设备 是 视觉 传感器 (visual sensor) ,包括 RGB 传 感 
器 、 深 度 (depth) 传 感 器 和 激光 雷达 (lidar) 传 感 器 等 , 输出 的 是 “对 世界 的 理解 ”。 

视觉 大 数据 主要 来 源 于 互联 网 ,移动 互 联网 、 广 电网 、 视 联网 等 。 例 如 ,Facebook 的 
注册 用 户 超过 8 亿 , 每 天 上 传 的 图 片 超过 3 亿 张 ,视频 超过 300 万 个 ;2009 一 2014 年 , 视 
频 监控 数据 每 年 都 以 PB 量 级 增长 。 视 觉 大 数据 的 分 析 与 理解 在 很 多 方面 都 有 重要 应 
用 ,如 自动 驾驶 、 网 络 信息 过 滤 、 公 安 刑侦 机 器 人 、 视 频 监 控 、 考 勤 安检 、 休 闲 娱乐 等 。 

大 规模 视觉 计算 是 对 大 规模 的 视觉 信息 的 分 析 与 处 理 , 它 具有 规模 大 、 类 别 多 ,来源 
广 这 3 个 主要 特点 。 挑 战 有 三 : 第 一 , 跨 景 跨 媒 。 跨 场景 指 的 是 视觉 数据 来 自 于 不 同 的 
应 用 场景 ; 跨 媒 体 指 的 是 图 像 或 者 视频 数据 的 出 现 通常 还 可 能 伴随 着 语音 或 文本 ,如 网 络 
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多 媒体 数据 。 第 二 ,海量 庞杂 。 视 觉 大 数据 不 仅 数据 规模 庞大 ,而 且 数 据 包含 的 内 容 广 
泛 , 例 如 ,可 能 有 娱乐 视频 ,体育 视频 、 新 闻 视频 、 监 控 视频 等 。 第 三 ,多 源 异 质 。 同 样 的 视 
觉 数 据 可 能 来 自 于 不 同 的 数据 源 ,例如 ,体育 视频 可 能 来 自 广 播 电 视 或 者 手机 拍摄 ,数据 
可 能 来 自 RGB 成 像 或 者 近 红 外 成 像 。 

在 小 规模 的 PascalVOC 数据 集 (20 类 目标 ,小 于 2 万 张 图 片 ) 上 ,传统 算法 的 分 析 精 
度 很 容易 达到 90% 以 上 。 但 是 ,对 于 大 规模 的 ImageNet 数据 集 (1000 类 目标 ,130 万 张 
图 片 ) ,同样 的 算法 其 分 析 精 度 通常 低 于 75%。 这 也 是 大 规模 视觉 计算 带 来 的 挑战 。 

深度 学 习 在 计算 机 视觉 领域 四 大 基本 任务 中 的 应 用 ,包括 分 类 ,定位 、 检 测 ,语义 分 割 
和 实例 分 割 ,如 图 7-35 所 示 。 





(a) 分 类 (b) 定位 、 检测 





= 
(语义 分 他 (实例 分 
图 7-35 “计算 机 视觉 基本 任务 





2. 大 规模 视觉 计算 的 关键 问题 

算法 层面 包含 大 规模 特征 表达 、 大 规模 模型 学 习 、 大 规模 知识 迁移 ;系统 层面 包含 大 
规模 数据 库 构 建 、 大 规模 数据 处 理 平台 。 华 人 科学 家 李 飞 飞 创建 的 大 规模 数据 集 
ImageNet 已 成 为 视觉 领域 的 经 典 数据 集 。 下 面 介绍 大 规模 视觉 计算 的 算法 层面 ,包括 大 
规模 的 特征 表达 、 模 型 学 习 和 知识 迁移 等 关键 问题 。 

(1) 大 规模 的 特征 表达 。 大 规模 的 特征 表达 就 是 在 多 源 异 质 的 视觉 大 数据 中 找到 具 
有 较 好 泛 化 性 和 不 变性 的 特征 。 在 模式 识别 和 计算 机 视觉 领域 中 ,强大 的 特征 对 于 实际 
应 用 效果 来 说 非常 关键 。 因 此 ,要 分 析 跨 景 跨 媒 、 多 源 异 质 的 视觉 大 数据 ,就 必须 找到 鲁 
棒 的 特征 表达 。 

(2) 大 规模 的 模型 学 习 。 视 觉 大 数据 时 代 , 我 们 需要 面 对 海 量 庞杂 、 种 类 繁多 的 视觉 
大 数据 。 人工 设计 的 特征 不 一 定 适用 于 大 规模 的 模型 学 习 。 深 度 学 习 可 以 直接 从 海量 数 
据 中 进行 模型 学 习 , 且 数据 量 越 多 ,模型 效果 越 好 ,这 是 深度 学 习 在 大 规模 视觉 计算 中 广 
泛 应 用 的 重要 因素 。 
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(3) 大 规模 的 知识 迁移 。 传 统 学 习 和 迁移 学 习 有 什么 区 别 ? 在 传统 学 习 中 ,每 一 数 
据 域 都 有 一 个 独立 的 学 习 系 统 , 且 不 同 域 之 间 的 学 习 过 程 是 相互 独立 的 。 在 迁移 学 习 中 ， 
源 域 学 习 得 到 的 知识 可 以 用 以 指导 目标 域 的 学 习 过 程 。 

为 什么 在 视觉 大 数据 背景 下 进行 知识 迁移 是 可 行 的 ? 答案 可 以 总 结 为 3V。 第 一 ， 
Volume。 数 据 规模 大 ,提供 了 足够 的 迁移 数据 源 。 第 二 ,Variety。 视 觉 大 数据 中 的 数据 
呈现 多 源 异 构 多 模 态 等 性 质 ,为 知识 迁移 提供 了 必要 条 件 。 第 三 ,Velocity。 如 今 数据 更 
新 的 速度 特别 快 ,利用 迁移 学 习 可 以 避免 重复 学 习 , 即 可 以 在 已 有 模型 的 基础 上 更 新 模 
型 ,而 不 必 对 所 有 数据 重新 学 习 。 

3. 图 像 分 类 卷 积 神经 网 络 设 计 

给 定 一 张 输 入 图 像 , 图 像 分 类 任务 旨 在 判断 该 图 像 所 属 类 别 。ImageNet 包括 1. 2M 
训练 图 像 .50K 验证 图 像 1K 个 类 别 。2017 年 及 之 前 ,每 年 会 举行 基于 ImageNet 数据 集 
的 ILSVRC 竞赛 ,这 相当 于 计算 机 视觉 界 奥 林 匹 克 。 

(1) 基本 架构 。 用 conv 代表 卷 积 层 、bn 代表 批量 归 一 层 、pool 代表 池 化 层 。 最 常见 
的 网 络 结构 顺序 是 conv 一 > bn 一 > relu 一 之 pool, 其 中 卷 积 层 用 于 提取 特征 , 池 化 层 
用 于 减少 空间 大 小 。 随 着 网 络 深度 的 进行 ,图 像 的 空间 大 小 将 越 来 越 小 ,而 通道 数 会 越 来 
越 大 。 

(2) 如 何 设计 网 络 。 面 对 实际 任务 时 ,如 果 目 标 是 完成 该 任务 ,而 不 是 发 明 新 算法 ， 
那么 不 要 试图 自己 设计 全 新 的 网 络 结构 ,也 不 要 试图 从 零 复 现 现 有 的 网 络 结构 。 找 已 经 
公开 的 实现 和 预 训练 模型 进行 微调 。 去 掉 最 后 一 个 全 连接 层 和 对 应 softmax, 加 上 当下 
任务 的 全 连接 层 和 softmax, 再 固定 住 前 面 的 层 ,只 训练 新 增加 的 部 分 。 如 果 你 的 训练 数 
据 比 较 多 ,那么 可 以 多 微调 几 层 ,甚至 微调 所 有 层 。 

(3) LeNet-5 60k 参数 。 网 络 基本 架构 为 conv1(6) 一 二 pooll 一 这 conv2(16) 一 二 
pool2 一 > fc3(120) 一 之 fc4(84) 一 之 fc5(10) 一 之 softmax, 如 图 7-36 所 示 。 括 号 中 
的 数字 代表 通道 数 ,网 络 名 称 中 的 “5" 表 示 它 有 5 个 conv/fc 层 。 当 时 ,LeNet-5 被 成 功用 
于 ATM, 以 对 支票 中 的 手写 数字 进行 识别 。LeNet 取 名 源 自 其 作者 姓 LeCun。 
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图 7-36 LeNet-5 手写 数字 识别 网 络 


(4) AlexNet 60M 参数 ,ILSVRC 2012 的 冠军 网 络 。 网 络 基 本 架构 为 conv1(96) 一 二 
pooll 一 之 conv2(256) 一 之 pool2 —> conv3(384) 一 二 conv4(384) —> conv5(256) —> 
pool5 一 之 fc6(4096) 一 之 fc7(4096) 一 之 fc8(1000) 一 这 softmax, 如 图 7-37 所 示 。 
AlexNet 有 着 和 LeNet-5 相似 的 网 络 结构 ,但 更 深 , 有 更 多 参数 。convl 使 用 11X11 的 滤 
波 器 . 步 长 为 4, 使 空间 大 小 迅速 减 小 (227X227 一 盖 55X55)。AlexNet 的 关键 点 是 : 
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使 用 了 ReLU 激活 函数 ,使 之 有 更 好 的 梯度 特性 ,训练 更 快 。 四 使 用 了 随机 失 活 
(dropout) 。@ 大 量 使 用 数据 扩充 技术 。AlexNet 的 意义 在 于 它 以 高 出 第 二 名 10% 的 性 
能 取得 了 当年 ILSVRC 竞赛 的 冠军 ,这 使 人 们 意识 到 卷 机 神经 网 络 的 优势 。 此 外 ， 
AlexNet 也 使 人 们 意识 到 可 以 利用 GPU 加 速 卷 积 神经 网 络 训练 。AlexNet 取 名 源 自 其 
作者 名 Alex。 
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图 7-37 ILSVRC 2012 的 冠军 网 络 


(5) VGG-16/VGG-19 138M 参数 ,ILSVRC 2014 的 亚军 网 络 。VGG-16 的 基本 架构 
为 conv1’2 (64) 一 之 pooll 一 之 conv2^2 (128) —> pool2 一 二 conv3^3 (256) 一 过 
pool3 一 二 conv4’3 (512) 一 之 pool4 一 二 conv5’3 (512) 一 二 pool5 —> fc6 (4096) —> 
fc7 (4096) 一 之 fc8 (1000) 一 > softmax。”3 代表 重复 3 次 ,如 图 7-38 所 示 。VGG 网 络 
的 关键 点 是 : 结构 简单 ,只 有 3X3 卷 积 和 2X2 池 化 两 种 配置 ,并 且 重 复 堆 释 相同 的 模 
块 组 合 。 卷 积 层 不 改变 空间 大 小 ,每 经 过 一 次 池 化 层 ,空间 大 小 减 半 。@@ 参 数量 大 ,而 且 
大 部 分 的 参数 集中 在 全 连接 层 中 。 网 络 名 称 中 的 “16” 表 示 它 有 16 个 conv/fc 层 。 回 合 
适 的 网 络 初始 化 和 使 用 批量 归 一 (batch normalization) 层 对 训练 深层 网 络 很 重要 。VGG- 
19 结构 类 似 于 VGG-16, 有 了 上 略 好 于 VGG-16 的 性 能 ,但 VGG-19 需要 消耗 更 大 的 资源 , 因 
此 实际 中 VGG-16 使 用 得 更 多 。 由 于 VGG-16 网 络 结构 十 分 简单 ,并 且 很 适合 迁移 学 习 ， 
因此 至 今 VGG-16 仍 在 广泛 使 用 。VGG-16 和 VGG-19 取 名 源 自 作者 所 处 研究 组 名 
(Visual Geometry Group) 。 
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图 7-38 ILSVRC 2014 的 亚军 网 络 
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4. 计算 机 视觉 和 深度 学 习 应 用 展望 

决定 计算 机 视觉 技术 能 否 被 大 规模 应 用 有 两 个 因素 : 第 一 是 准确 率 ;第 二 是 成 本 。 
只 有 很 好 地 解决 了 这 两 个 因素 ,视觉 技术 才 会 得 到 大 规模 的 应 用 。 从 技术 角度 来 讲 , 计 算 
机 视觉 大 规模 应 用 的 路 径 应 该 是 一 个 从 云 到 端 再 到 芯片 的 渐进 过 程 。 

第 一 个 阶段 : 云 的 方式 。 即 运算 发 生 在 服务 器 端 ,无 论 是 公有 云 , 还 是 私有 云 ,摄像 
头 的 数据 都 被 传 回 到 服务 器 端 进行 处 理 和 和 运算。 这 个 方式 最 大 的 好 处 是 能 促进 算法 的 快 
速 落 地 ,产生 大 量 数据 ,帮助 实现 快速 的 迭代 算法 ,促进 算法 的 成 熟 , 推 动 应 用 的 发 展 。 云 
的 优势 在 于 快速 灵活 ,所 以 早期 应 该 采用 云 的 方式 。 

第 二 个 阶段 : 云 十 端的 方式 。 通 过 端 帮助 云 做 一 些 运 算 量 比较 少 的 工作 ,主要 优势 
在 于 这 样 可 以 减少 网 络 带宽 ,如 果 把 所 有 的 视频 数据 都 传 回 中 心 ,网络 带宽 开销 是 非常 大 
的 ;其 次 ,基于 云 十 端的 方式 可 以 把 运算 由 中 心 分 散 到 前 端 ,这 将 是 未 来 的 一 个 重要 趋势 。 

第 三 个 阶段 : 采用 芯片 的 方式 。 芯 片 能 够 降低 成 本 ,同时 提高 运算 能 力 。 但 是 ,芯片 
一 定 是 在 一 个 大 规模 应 用 状态 下 的 终极 阶段 。 这 个 结果 是 有 条 件 的 ,就 是 必须 等 到 算法 
成 熟 , 而 且 大 众 也 接受 这 种 应 用 。 

从 产业 链 的 角度 ,只 有 深入 到 场景 中 才能 够 形成 闭环 ,获得 数据 。 只 有 拥有 业务 和 数 
据 之 后 ,才能 形成 真正 的 护城河 。 例 如 ,阿里 和 腾讯 一 定 不 是 技术 最 好 的 公司 ,为 他 们 服 
务 的 思科 、 华 为 .联通 .中 国电 信 这 样 的 公司 技术 会 更 好 ,但 最 终 却 只 有 阿里 和 腾讯 形成 了 
生态 ,有 了 护城河 。 简 单 的 算法 提供 更 像 思科 这 种 设备 提供 商 的 角色 ,在 生态 里 面 最 终 能 
获得 的 价值 实际 上 是 非常 少 的 。 

深度 学 习 在 计算 机 视觉 中 的 应 用 展望 

(1) 深度 图 像 分 析 。 需 要 进一步 提升 算法 的 性 能 ,进而 转化 相应 的 实际 应 用 。 例 如 ， 
微软 发 布 的 App, 用 户 上 传 图 片 识别 其 年 龄 或 者 性 别 ,但 有 时 会 出 错 。 

(2) 深度 视频 分 析 。 视 频 相 对 于 图 片 来 说 ,其 内 容 更 加 复杂 且 包 含 运动 信息 ,做 起 来 
难度 更 大 ,因此 ,深度 视频 分 析 还 处 于 起 步 阶段 。 但 是 ,视频 分 析 的 应 用 很 广 。 例 如 ,人 机 
交互 的 行为 识别 .监控 视频 分 析 、 第 一 视角 的 视频 分 析 等 ,因此 加 强 深度 视频 分 析 可 能 是 
未 来 的 方向 。 

(3) 大 规模 的 深度 学 习 。 随 着 时 间 的 推移 ,为 了 处 理 更 大 规模 的 数据 ,需要 进行 多 
GPU 并 行 的 分 布 式 计算 ,这 是 处 理 海量 数据 必须 做 的 。 

(4) 无 监督 ( 半 监 督 ) 学 习 。 实 际 应 用 中 ,监督 信息 大 多 数 都 是 缺失 的 , 且 标 注 的 代价 
也 十 分 高 昂 ,因此 要 在 充分 利用 标注 数据 的 基础 上 进行 无 监督 或 半 监 督学 习 。 

(5) 大 规模 多 模 态 学 习 。 多 模 态 数据 无 处 不 在 ,不 同 模 态 数据 的 内 容 具 有 一 致 性 或 
互补 性 。 利 用 互补 性 可 以 做 多 模 态 数据 的 融合 ,进而 更 有 效 地 解决 问题 ;利用 一 致 性 ,还 
可 以 做 跨 模 态 的 图 像 文 本 检索 。 

(6) 类 脑 智能 研究 。 深 度 神经 网 络 本 身 是 模拟 大 脑 前 馈 提 出 的 网 络 结构 模型 ,但 是 
当前 大 部 分 生物 机 制 还 没有 应 用 到 深度 神经 网 络 中 。 因 此 ,类 脑 智能 研究 是 有 潜力 且 更 

计算 机 视觉 的 终极 目标 是 “建立 一 个 智能 的 系统 ,能 够 让 计算 机 和 机 器 人 像 人 一 样 看 
懂 世 界 , 也 可 能 超越 人 类 , 比 人 类 更 能 看 懂 这 个 世界 ”。 深 度 学 习作 为 人 工 智 能 的 一 种 形 
式 ,通过 组 合 低层 特征 形成 具有 抽象 表示 的 深层 神经 网 络 , 模 拟人 脑 的 思维 进行 感知 、 识 











358 


人 工 乔 能 ( 荔 3 瞩 ) 


别 和 记忆 ,突破 了 低层 特征 到 高 层 语义 理解 的 障碍 , 极 大 地 提升 了 机 器 在 视觉 特征 的 提 
取 、 语 义 分 析 和 理解 方面 的 智能 处 理 水 平 。 随 着 计算 机 技术 和 人 工 智 能 的 发 展 ,期 待 计算 
机 视觉 研究 取得 更 大 的 突破 ,在 社会 生活 中 得 到 更 加 广泛 的 应 用 。 


7.3.6 竞争 网 络 


Hei 网 络 是 最 简单 的 竞争 网 络 之 一 ,其 输出 层 的 神经 元 通过 互相 竞争 从 而 产生 
一 个 胜 者 。 这 个 胜 者 表明 了 何 种 标准 模式 最 能 代表 输入 模式 。 这 种 竞争 是 通过 输出 层 神 

经 元 之 间 的 一 组 负 连 接 ( 即 侧 向 抑制 ) 实 现 的 。 

我 们 首先 从 简单 的 竞争 网 络 开始 ,然后 介绍 结合 网 络 拓扑 结构 的 自 组 织 特征 图 模型 ， 
最 后 讨论 学 习 向 量 量化 网 络 , 它 将 竞争 和 有 监督 学 习 框架 相 结 合 。 

1. Hamming 网 络 

由 于 本 节 讨 论 的 竞争 网 络 与 Hamming 网 络 ( 图 7-39) 密 切 相关 ,所 以 有 必要 先 介绍 
Hamming 网 络 的 一 些 基 本 概念 。 














A、 圳 归 层 
2 (0+D (+D | on) 
加 a 一 
Or 四 Sx1 4 Sxl Sxl 
SxS 
加 1 S 











一 


al=purelin( Wip+b') (0)=al (HTD=poslin(F2e2(D)) 
图 7-39 Hamming 网 络 


Hamming 网 络 包 含 两 层 : 第 一 层 (是 一 个 instar 层 ) 将 输入 向 量 和 标准 向 量 相互 关 
联 起 来 ;第 二 层 采用 竞争 方式 确定 最 接近 输入 向 量 的 标准 向 量 。 

1) 第 一 层 

单个 instar 只 能 识别 一 种 模式 。 为 了 实现 多 模式 分 类 ,需要 多 个 instar, Hamming 
网 络 实现 了 这 一 点 。 

假设 要 让 网 络 识别 如 下 的 标准 向 量 : 


了 ee 
1Piypz pa 
则 第 一 层 的 权 值 矩阵 Wi' 和 偏 置 向 量 b 为 
了 pT R 
2 了 R 
Ws= | | = (7-46) 
a pa R 


其 中 ,W' 的 每 一 行 代表 了 一 个 想 要 识别 的 标准 向 量 ,b' 中 的 每 一 个 元 素 都 设 为 等 于 输入 
向 量 的 元 素 个 数 尺 。( 神 经 元 的 数量 S 等 于 将 要 被 识别 的 标准 向 量 的 个 数 Q) 
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因此 ,第 一 层 的 输出 为 
pip+R 


pip+R 


a=Wip+b = (7-47) 





pap +R 
注意 ,第 一 层 的 输出 等 于 标准 向 量 与 输入 的 内 积 再 加 上 RR。 内 积 表 明了 标准 向 量 与 
输入 向 量 之 间 的 接近 程度 。 
2) 第 二 层 
在 instar 中 , 使 用 hardlim 传输 函数 决定 输入 向 量 是 否 足 够 接近 标准 向 量 。 
Hamming 网 络 的 第 二 层 拥 有 多 个 instar, 因 此 需要 确定 哪个 标准 向 量 与 输入 最 接近 。 我 
们 会 使 用 一 个 竞争 层 代替 hardlim 传输 函数 ,以 选择 最 接近 的 标准 向 量 。 
第 二 层 是 一 个 竞争 层 , 这 一 层 的 神经 元 使 用 前 馈 层 的 输出 进行 初始 化 ,这 些 输 出 指明 
了 标准 模式 和 输入 向 量 间 的 相互 关系 。 然 后 这 一 层 的 神经 元 之 间 相互 竞争 ,以 决 出 一 个 
胜 者 , 即 竞争 过 后 只 有 一 个 神经 元 具有 非 零 输出 。 获 胜 的 神经 元 指明 了 输入 数据 所 属 的 
类 别 ( 每 一 个 标准 向 量 代表 一 个 类 别 ) 。 
首先 ,使 用 第 一 层 的 输出 @ 初始 化 第 二 层 。 
az(0) 一 al 
然后 ,根据 以 下 递归 关系 更 新 第 二 层 的 输出 。 
a (t+1) 一 poslin(CW2a2(0)) (7-48) 
第 二 层 的 权 值 矩 阵 多 ? 的 对 角 线 上 的 元 素 被 设 为 1, 非 对 角 线 上 的 元 素 被 设 为 一 个 很 
小 的 负数 。 
下 1 
wi 一 a 0<e<s=i 
该 矩阵 产生 侧 向 抑制 (lateral inhibition) , 即 每 一 个 神经 元 的 输出 都 会 对 所 有 其 他 的 
神经 元 产生 一 个 抑制 作用 。 为 了 说 明 这 种 作用 ,用 1 和 一 e 代替 W? 中 对 应 的 元 素 , 针 对 
单个 神经 元 重 写 式 (7-48) 。 
a (tt) = poslin (ai(CO) 一 of) 


在 每 次 迭代 中 ,每 一 个 神经 元 的 输出 将 会 随 着 其 他 神经 元 的 输出 之 和 成 比例 减 小 
(最 小 的 输出 为 0)。 具 有 最 大 初始 条 件 的 神经 元 的 输出 会 比 其 他 神经 元 的 输出 减 小 得 
慢 些 。 最 终 该 神经 元 成 为 唯一 一 个 拥有 正 值 输 出 的 神经 元 。 此 时 ,网 络 将 达到 一 个 稳 
定 的 状态 。 第 二 层 中 拥有 稳定 正 值 输出 的 神经 元 的 索引 即 与 输入 最 匹配 的 标准 向 量 
的 索引 。 

于 只 有 一 个 神经 元 拥有 非 0 输出 ,因此 我 们 把 上 述 的 竞争 学 习 规则 称 作 胜 者 全 得 
(winner-take-all) 竞 争 。 

2. 竞争 层 

Hamming 网 络 第 二 层 之 所 以 被 称 为 竞争 (competition) 层 ,是 由 于 其 每 个 神经 元 都 激 
活 自身 并 抑制 其 他 所 有 神经 元 。 我 们 定义 一 个 传输 函数 实现 递归 竞争 层 的 功能 。 


a = compet (n) 
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它 找到 拥有 最 大 净 输 入 的 神经 元 的 索引 站 ,并 将 该 神经 元 的 输出 置 为 1( 平 局 时 选 索 引 最 
小 的 神经 元 ) ,同时 将 其 他 所 有 神经 元 的 输出 置 为 0。 
l,i=i* 

an be 让 

使 用 这 个 竞争 传输 函数 作用 在 第 一 层 上 ,替代 Hamming 网 络 的 递归 层 ,这 样 将 简化 
陈述 。 图 7-40 为 一 个 网 络 竞争 层 。 输入 竞争 层 

和 Hamming 网 络 一 样 ,标准 向 量 被 存储 在 W 和 矩阵 的 A 站 NAN 
行 中 。 网 络 净 输入 计算 了 输入 向 量 p 与 每 一 个 标准 向 
量 ;w 之 间 的 距离 (假设 所 有 的 向 量 都 被 归 一 化 ,长 度 为 
L)。 每 个 神经 元 i 的 净 输 入 nn; 正比 于 与 标准 向 量 ;w 之 
间 的 夹 角 0;。 


,对 所 有 i,n;* 宇 n; 且 对 所 有 nn; = 二 nt ,i* 三 i 











z 
1r 1™ 2 
p L’ cosO a=compet(Wy) 
wT - . 
2 27 万 L’ cosO, 
a 中 - 图 7-40 网 络 竞争 层 
oT p Lcos0, 


竞争 传输 函数 将 方向 上 与 输入 向 量 最 接近 的 权 值 向 量 对 应 的 神经 元 输出 设置 为 1 。 
a = compet (Wp) 

1) 竞争 学 习 

通过 将 W 的 行 设置 为 期 望 的 标准 向 量 , 可 设计 一 个 竞争 网 络 分 类 器 。 然 而 ,我 们 更 
希望 找到 一 个 学 习 规 则 ,使 得 在 不 知道 标准 向 量 的 情况 下 也 能 训练 竞争 网 络 的 权 值 。 
instar 规则 便 是 这 样 的 学 习 规则 。 

im(q) 一 Pd 一 1) 十 aai(q)CPC9) 一 六 (9 一 1)) 

因为 竞争 网 络 中 仅 有 获胜 神经 元 (i 二 i* ) 对 应 的 a 中 的 非 0 元 素 , 所 以 使 用 Kohonen 

规则 也 能 得 到 同样 的 结果 。 
(gq)=i(g—1)+a(p(g) —i"(g— 1)) 
一 (1 一 ac)iw(q 一 1) 十 ap(q) 


i(g@) =i"(g—1) i 
因此 , 权 值 矩 阵 中 最 接近 输入 向 量 的 行 ( 即 与 输入 向 量 的 内 积 最 大 的 行 ) 向 着 输入 向 
量 靠近 , 它 沿 着 权 值 矩 阵 原来 的 行 向 量 与 输入 向 量 之 间 的 连 线 移动 ,如 图 7-41 所 示 。 

下 面 使 用 图 7-42 中 的 6 个 向 量 演示 竞争 层 网 络 是 如 何 学 会 分 类 的 。 这 6 个 向 量 为 


[一 0.1961 fo.1961 ~ fo. 9806 
P= 加 9806 | 加 | 806| | 
0.9806 [一 0%.5812] [一 0.8137 
| ‘oor 攻 [sa 二 [ | 
这 里 使 用 的 竞争 网 络 将 有 3 个 神经 元 ,因此 它 可 把 这 些 输入 向 量 分 为 3 类 。 下 面 是 
“随机 ?选择 的 归 一 化 的 初始 权 值 。 





第 7 芋 如 加 学 习 一 361 





图 7-41 Kohonen 规则 的 图 示 图 7-42 输入 向 量 样本 


[ 7071 ] 相 | 攻 wd 
= ,2" = ,3" 一 ‘w= 
一 0.7071 0.7071 0. 0000 

数据 向 量 和 权 值 向 量 如 图 7-43 所 示 , 其 中 权 值 向 量 用 箭头 表示 。 

将 向 量 ps 输入 到 网 络 后 ,可 得 





0.7071 一 0.7071 
a= compet (Wp;:) = compet||0.7071 0.7071 | 
一 1.0000 0.0000 
0. 8321 


0 
| 
一 0. 1961 0 


从 上 式 可 见 , 第 二 个 神经 元 的 权 值 向 量 最 接近 p, ,所 以 它 竞争 获胜 (i* = 二 2) 且 输出 值 为 1 。 
现在 应 用 Kohonen 学 习 规则 更 新 获胜 神经 元 的 权 值 向 量 , 其 中 学 习 率 a 二 0. 5。 
a 十 a(CPsz 一 呈 ) 
0.7071 0.1961] [0.7071 0. 4516 
bb ed oil 和 xz- | | 

正如 图 7-44 所 示 ,Kohonen 规则 移动 ,w, 以 使 其 接近 p, 。 如 果 继 续 随机 选择 输入 向 量 并 
把 它们 输入 网 络 , 那 么 每 次 迭代 后 ,与 输入 向 量 最 接近 的 权 值 向 量 将 会 向 着 这 个 输入 向 量 
移动 。 最 终 ,每 个 权 值 向 量 将 指向 输入 向 量 的 不 同 秘 , 且 将 变 成 不 同 徐 的 标准 向 量 。 


pi Pp 


0. | 
0.9806 
一 0.5547 
= compet 
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图 7-43 数据 向 量 和 权 值 向 量 图 7-44 移动 :w 


ps 
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这 个 例子 可 以 预测 哪 一 权 值 向 量 将 指向 哪 一 秘 , 最 终 的 权 值 将 类 似 图 7-45 所 示 。 

一 旦 网 络 学 会 了 将 输入 向 量 进行 分 类 ,那么 它 也 会 相应 地 对 新 向 量 进行 分 类 。 
如 图 7-46 所 示 ,3 个 不 同 深 线 的 扇形 阴影 区 域 分 别 表示 每 个 神经 元 将 做 出 响应 的 区 
域 。 通 过 使 得 权 值 向 量 最 接近 于 输入 向 量 p 的 神经 元 的 输出 为 1, 竞争 网 络 将 p 归 


和 


图 7-45 最 终 的 权 值 图 7-46 每 个 神经 元 对 应 一 个 响应 区 域 


2) 竞争 层 存 在 的 问题 

竞争 层 能 有 效 地 进行 自 适应 分 类 ,但 它 也 存在 如 下 问题 : 四 学 习 率 的 选择 必须 在 学 
习 度 与 最 终 权 值 向 量 的 稳定 性 之 间 进 行 折 中 ; @ 当 入 彼此 间 很 靠近 时 ,会 出 现 更 严重 的 
稳定 性 问题 ; @ 有 时 某 个 神经 元 的 初始 权 值 向 量 离 所 有 输入 向 量 都 太 远 ,以 至 于 它 从 未 
在 竞争 中 获胜 ,因此 也 就 从 未 得 到 学 习 ; @ 通 常情 况 , 竞 争 层 的 神经 元 个 数 等 于 类 别 数 ， 
但 这 在 一 些 应 用 中 是 不 适用 的 ,尤其 是 在 事先 不 知道 类 别 数量 的 情况 下 。 此 外 ,竞争 层 要 
求 每 个 类 由 输入 空间 的 一 个 凸 区 域 构成 。 因 此 , 当 类 由 非 凸 区 域 或 由 多 个 不 连通 区 域 构 
成 时 ,竞争 层 将 不 能 实现 分 类 。 这 些 问题 将 在 后 续 介 绍 的 特征 图 网 络 和 LVQ 网 络 中 得 
到 解决 。 

3. 生物 学 中 的 竞争 层 

前 面 的 章节 没有 提 及 神经 元 在 层 内 是 如 何 组 织 的 ( 即 网 络 的 拓扑 结构 )。 在 生物 神经 
网 络 中 ,神经 元 之 间 通 常 排列 为 二 维 层次 ,通过 侧 向 反馈 紧密 互 连 。 图 7-47 展示 了 一 个 
由 25 个 神经 元 以 二 维 网 格 形式 排列 在 一 起 的 层 。 

通常 , 权 值 是 相互 连接 的 神经 元 间距 离 的 函数 。 例 如 , Hamming 网 络 的 第 二 层 的 权 
值 赋值 如 下 。 


pi Pp 


p; 





ps 
ps 


_ 1, i=j 
~ N= 1 天) 
式 (7-50) 与 式 (7-49) 赋 值 相 同 , 只 是 式 (7-50) 是 基于 神经 元 之 间 的 距离 di 。 
1， dy=0 
twij 一 (7-50) 
本 < 二 0 
式 (7-49) 或 式 (7-50) 所 赋 的 权 值 如 图 7-48 所 示 。 图 中 ,每 一 个 神经 元 i 上 标记 了 连接 权 
值 w; , 即 从 它 到 神经 元 j 的 连接 。 


vw (7-49) 


bj 
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图 7-47 以 二 维 网 格 形式 排列 神经 元 图 7-48 神经 元 j 赋 权 


加 强 中 心 /抑制 周围 (on-center/off-surround) 通 常用 来 描述 如 下 一 种 神经 元 之 间 的 
连接 模式 : 每 个 神经 元 加 强 自身 (中 心 ), 同 时 抑制 所 有 其 他 的 神经 元 (周围 )。 

其 实 ,这 是 生物 学 竞争 层 的 一 种 较为 粗略 的 近似 。 在 生物 学 中 ,一 个 神经 元 不 仅 加 强 
它 自 己 ,也 加 强 它 附近 的 神经 元 。 通 常 ,从 加 强 到 抑制 的 转变 是 随 着 神经 元 之 间距 离 的 增 
加 而 平滑 出 现 的 。 

这 种 转变 如 图 7-49 左 所 示 , 它 是 一 个 将 神经 元 之 间 的 距离 与 它们 之 间 的 权 值 联系 起 
来 的 函数 。 相 互 靠近 的 神经 元 之 间 会 产生 激励 (加 强 ) 连 接 , 且 激励 的 强度 随 着 距离 的 增 
大 而 减 小 。 超 过 一 定 距离 ,神经 元 之 间 开 始 呈 现 抑 制 连接 , 且 抑 制 的 强度 随 着 距离 的 增 大 
而 增 大 。 因 为 这 个 函数 的 形状 , 它 被 称 作 墨 西 哥 草帽 函数 (mexican-hat function)。 
图 7-49 的 右 图 是 墨西哥 草帽 (加 强 中 心 /抑制 周围 ) 函 数 的 二 维 图 示 。 图 中 ,每 个 神经 元 
i 上 都 标 以 它 到 神经 元 j 的 权 值 wi 的 符号 和 相对 强度 。 

wy 神经 元 j 
@@@@@@ 
+ 介 @@@ 介 
ds ODOO 
避 ©O@O@O®9 
@@@@ 人 人 


图 7-49 生物 学 中 的 加 强 中 心 /抑制 周围 层 


生物 竞争 系统 中 ,除了 在 加 强 中 心 / 抑 制 周围 的 连接 模式 下 激励 和 抑制 的 区 域 之 间 
是 渐变 外 ,还 有 一 种 比 Hamming 网 络 中 * 胜 者 全 得 ?的 竞争 较 弱 的 竞争 形式 。 生 物 网 
络 通常 不 是 单一 神经 元 活跃 (竞争 获胜 ) ,而 是 有 一 个 以 最 为 活跃 的 神经 元 为 中 心 的 活 
路 区 。 这 在 某 种 程度 上 是 由 于 加 强 中 心 /抑制 周围 的 连接 模式 和 非 线 性 的 反馈 连接 引 
起 的 。 

4. 自 组 织 特征 图 

为 了 模仿 生物 系统 的 活动 区 , 且 不 必 实 现 非 线 性 的 加 强 中 心 /抑制 周围 的 反馈 连接 ， 
Kohonen 设计 了 如 下 简化 形式 ,提出 了 自 组 织 特征 图 (Self-Organizing Feature Maps， 
SOFM) 。SOFM 网 络 首先 使 用 与 竞争 层 网 络 相同 的 方式 得 到 获胜 的 神经 元 i” ,然后 采 
用 Kohonen 规则 更 新 获胜 神经 元 周围 某 一 特定 邻 域内 所 有 神经 元 的 权 值 向 量 。 


一 是 
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i”(qg) 一:”(q 一 1) 十 c(P(q) —"(g— 1)) pe ad) 
= (1—a):"(g—1)++ap(g) 
其 中 , 邻 域 N;, Cd) 包括 所 有 落 在 以 获胜 神经 元 为 中 心 .d 为 半径 的 圆 内 的 神经 元 的 下 
标 , 即 
ND = {dy 和 

当 一 个 向 量 p 输 入 网 络 时 ,获胜 神经 元 及 其 邻 域内 神经 元 的 权 值 将 会 向 pp 移动。 结果 
是 ,在 向 量 被 多 次 输入 网 络 之 后 , 邻 域内 的 神经 元 将 会 学 习 到 彼此 相似 的 向 量 。 

例如 ,为 了 展示 邻 域 的 概念 ,可 参考 图 7-50 所 示 的 两 幅 图 。 图 7-50 左 描述 了 围绕 神 
经 元 13, 半 径 d=1 的 二 维 邻 域 ,图 7-50 右 显示 的 是 其 半径 d=2 的 邻 域 。 


OO@OO0 


© OO @ 
+0 
@ Oo-@ g@ 
@aeg@eg@gg@ 


Nal) 





图 7-50 邻 域 


这 两 个 邻 域 定义 如 下 。 

Ni(1)={8,12,13,14,18} 

Nis (2)={3,7,8,9,11,12,13,14,15,17,18,19,23} 

需要 说 明 的 是 ,SOFM 中 的 神经 元 不 必 排 列 成 二 维 形式 , 它 也 可 能 以 一 维 \ 三 维 甚至 
更 高 维 的 形式 排列 。 对 于 一 个 一 维 SOFM , 非 端点 处 的 每 个 神经 元 半径 为 1 的 邻 域内 只 
有 2 个 邻居 神经 元 (位 于 端点 处 的 神经 元 仅 有 1 个 邻居 神经 元 ) 。 当 然 ,距离 的 定义 可 以 
有 多 种 方式 。 例 如 ,为 了 高 效 实现 ,Kohonen 提议 使 用 矩形 或 者 六 边 形 邻 域 。 事 实 上 ,网 
络 的 性 能 对 邻 域 的 具体 形状 并 不 敏感 。 

现在 我 们 来 展示 一 下 SOFM 网 络 的 性 能 。 图 7-51 是 一 个 特征 图 及 其 神经 元 的 二 维 
拓扑 结构 。 

图 7-52 展示 了 特征 图 的 初 值 权 值 向 量 。 每 个 三 元 权 值 向 量 以 球体 上 的 一 个 点 表示 
〈 权 值 已 经 归 一 化 ,因此 向 量 会 落 在 球面 上 ) 。 邻 居 神 经 元 的 点 都 用 线 连接 起 来 ,因而 可 以 
看 出 网 络 拓扑 结构 在 输入 空间 中 是 如 何 组 织 的 。 

图 7-53 展示 了 球体 表面 的 一 个 方形 区 域 。 我 们 将 从 这 一 区 域 随机 选取 一 些 向 量 , 并 
将 其 输入 特征 图 网 络 。 

每 当 一 个 向 量 输 入 网 络 时 ,具有 与 其 最 近 的 权 值 向 量 的 神经 元 将 竞争 获胜 。 获 胜 的 
神经 元 及 其 邻居 神经 元 将 移动 它们 的 权 值 向 量 向 输入 向 量 靠近 (因此 它们 也 互相 靠近 )。 
本 例 中 使 用 的 是 半径 为 1 的 邻 域 。 
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图 7-51 自 组 织 特征 图 





图 7-52 特征 图 的 初 值 权 值 向 量 图 7-53 球体 表面 的 一 个 方形 区 域 


权 值 向 量 的 变化 有 两 个 趋势 : 四 随 着 更 多 的 向 量 输入 网 络 , 权 值 向 量 将 分 布 到 整个 
输入 空间 ; @@ 邻 域 神经 元 的 权 值 向 量 互相 靠近 。 这 两 个 趋势 共同 作用 使 得 该 层 神经 元 将 
重新 分 布 ,最 终 使 得 网 络 能 对 输入 空间 进行 划分 。 


图 7-54 所 示 的 一 系列 图 展示 了 25 个 神经 元 的 权 值 是 如 何在 活动 的 输入 空间 展开 ， 
并 组 织 以 匹配 其 拓扑 结构 的 。 


NA 
NE 


图 7-54 自 组 织 (经 过 250 次 迭代 后 的 结果 ) 
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本 例 中 ,由 于 输入 向 量 是 以 同等 概率 从 输入 空间 的 任意 一 个 点 产生 的 ,所 以 神经 元 将 


输入 空间 分 为 了 大 致 相等 的 区 域 。 
到 目前 为 止 ,我 们 仅 讨论 了 训练 特征 图 的 最 基本 算法 。 现 在 考虑 几 种 能 够 加 速 自 组 
织 过 程 并 使 其 更 可 靠 的 技术 。 


一 种 改进 特征 图 性 能 的 方法 是 在 训练 过 程 中 改变 邻 域 的 大 小 。 初 始 时 ,设置 较 大 的 
邻 域 半 径 d, 随 着 训练 的 进行 ,逐渐 减 小 & ,直到 邻 域 只 包括 竞争 获胜 的 神经 元 。 这 种 方 
法 能 加 速 网 络 的 自 组 织 ,而 且 使 得 网 络 中 出 现 扭曲 现象 的 可 能 性 极 小 。 

学 习 率 也 可 以 随 着 时 间 变 化 。 初 始 时 , 值 为 1 的 学 习 率 可 使 神经 元 快速 学 习 到 输入 
向 量 。 在 训练 过 程 中 ,学 习 率 逐渐 降 至 0, 使 得 学 习 变 得 稳定 。 

另外 一 种 加 快 自 组 织 的 方法 是 让 获胜 神经 元 使 用 比邻 居 神 经 元 更 大 的 学 习 率 。 

最 后 ,竞争 层 和 特征 图 也 常常 采用 其 他 方式 的 净 输 入 。 除 了 使 用 内 积 外 ,它们 还 可 直 
接 计 算 输 入 向 量 与 标准 向 量 之 间 的 距离 作为 网 络 输入 。 这 种 方式 的 优点 是 无 须 对 输入 向 
量 进 行 归 一 化 。 下 面 的 LVQ 网 络 中 将 会 介绍 这 种 净 输 入 。 

5. 学 习 向 量 量 化 

下 面 介绍 学 习 向 量 量化 (Learning Vector Quantization,LVQ) 网 络 , 如 图 7-55 所 示 。 
LVQ 网 络 是 一 种 混合 型 网 络 , 它 使 用 无 监督 和 有 监督 学 习 实 现 分 类 。 

竞争 导 线性 层 


输入 


p nl! 如 有 
Rxl -["] sx | 二" Sxl 
SxS! 


SIxR 








Ss s 
由 = 二 下 -| OH 
al= compet(n') 


图 7-55 LVQ 网 络 


在 LVQ 网 络 中 ,第 一 层 的 每 一 个 神经 元 都 会 被 指定 给 一 个 类 ,常常 会 有 多 个 神经 元 
被 指定 给 同一 个 类 。 每 类 又 被 指定 给 第 二 层 的 一 个 神经 元 。 因 此 ,第 一 层 的 神经 元 个 数 
S! 与 第 二 层 的 神经 元 个 数 S: 至 少 相同 ,并 且 通 常会 更 大 些 。 

和 竞争 网 络 一 样 ,LVQ 网 络 第 一 层 的 每 一 个 神经 元 都 学 习 一 个 标准 向 量 , 从 而 可 以 
区 分 输入 空间 的 一 个 区 域 。 然 而 ,在 LVQ 网 络 中 ,我 们 通过 直接 计算 输入 和 权 值 向 量 之 
间 的 距离 表示 两 者 之 间 的 相似 度 , 而 非 计算 内 积 。 直 接 计算 距离 的 一 个 优点 是 无 须 对 输 
入 向量 归 一 化 。 当 向 量 归 一 化 之 后 ,无 论 是 使 用 内 积 , 还 是 使 用 直接 计算 距离 的 方法 ,网 
络 的 响应 都 是 一 样 的 。 

LVQ 第 一 层 的 净 输 入 为 





= lw'—pl 


以 向 量 的 形式 可 表示 为 
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上” 一 | 
二 12 —pl 
1s —pl 
LVQ 网 络 第 一 层 的 输出 为 
a! = compet (n') 


因此 ,与 输入 向 量 最 接近 的 权 值 向 量 对 应 的 神经 元 的 输出 为 1, 其 他 神经 元 的 输出 为 0。 

至 此 ,LVQ 网 络 与 竞争 网 络 的 行为 几乎 完全 相同 (至 少 对 归 一 化 的 输入 向 量 而 言 ) 。 
两 个 网 络 的 差异 在 于 解释 上 。 竞 争 网 络 中 , 非 0 输出 的 神经 元 指明 输入 向 量 所 属 的 类 。 
而 LVQ 网 络 中 ,获胜 神经 元 表示 的 是 一 个 子 类 (subclass) ,而 非 一 个 类 ,可 能 有 多 个 不 同 
的 神经 元 ( 子 类 ) 组 成 一 个 类 。 

LVQ 网 络 的 第 二 层 使 用 权 值 矩阵 Wr 将 多 个 子 类 组 合成 一 个 类 。W? 的 列 代表 子 
类 ,而 行 代表 类 。W? 的 每 列 仅 有 一 个 元 素 为 1, 其 他 的 元 素 都 设 为 0。1 所 在 的 行 代表 对 
应 子 类 所 属 的 类 。 

(wii 二 1) 过 子 类 i 是 类 别 k 的 一 部 分 

这 种 将 子 类 组 合成 一 个 类 的 过 程 使 得 LVQ 网 络 可 产生 复杂 的 类 边界 。LVQ 网 络 突破 
了 标准 竞争 层 网 络 只 能 够 形成 凸 决策 区 域 的 局 限 。 

LVQ 网 络 的 学 习 结合 了 竞争 学 习 和 有 监督 学 习 。 正 如 所 有 的 有 监督 学 习 算 法 一 样 ， 
它 需 要 一 组 带 标记 的 数据 样本 。 

{pisti} (pzvtz (pasta} 

每 一 个 目标 向 量 中 除 一 个 元 素 为 1 外 ,其 他 必须 是 0。1 出 现 的 行 指 明 输 入 向 量 所 属 

的 类 。 例 如 ,假设 需要 将 一 个 三 元 向 量 分 类 到 四 个 类 中 的 第 二 类 ,可 表示 为 








0 
V1/2 了 

一 |0 ?和 一 
pi 1 0 
V1/2 0 


在 学 习 开 始 前 ,第 一 层 的 每 个 神经 元 会 被 指定 给 一 个 输出 神经 元 ,这 就 产生 了 和 矩阵 
W?。 通 常 ,与 每 一 个 输出 神经 元 相连 接 的 隐 层 神经 元 的 数量 都 相同 ,因此 每 个 类 都 可 以 
由 相同 数量 的 凸 区 域 组 成 。 除 了 下 述 情况 外 ,矩阵 W* 中 的 所 有 元 素 都 置 为 0。 

如 果 隐 层 神经 元 i 被 指定 给 类 , 则 置 ws? 一 1 
W? 一 旦 赋值 ,其 值 将 不 再 改变 。 而 隐 层 权 值 W' 则 采用 Kohonen 规则 的 一 种 变化 形式 进 
行 训练 。 

LVQ 的 学 习 规则 如 下 : 在 每 次 迭代 中 .将 向 量 p 输入 网 络 并 计算 p 与 标准 向 量 之 间 
的 距离 ; 隐 层 神经 元 进行 莞 争 , 当 神 经 元 i 竞争 获胜 时 ,将 @ 的 第 个 元 素 设 为 1; al 与 
W? 相 乘 得 到 最 终 输 出 a* 。a? 仅 含 一 个 非 0 元素 &” ,表明 输入 p 被 归 为 类 k*。 

Kohonen 规则 通过 以 下 方式 改进 LVQ 网 络 的 隐 层 。 如 果 p 被 正确 分 类 , 则 获胜 神 
经 元 的 权 值 ;. w' 向 p 移动 。 

Wi(g) = 二 ;a wi(g 一 ]) 十 a(p(g) 一: w (gq 一 1)), 如 果 af: = 二 4* 三 1 
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如 果 p 没有 被 正确 分 类 ,那么 我 们 知道 错误 的 隐 层 神经 元 赢得 了 竞争 , 故 移动 权 值 ;. w! 
远离 p。 

Wi(g) = 二; wi(g 一 1) 一 a(p(g) 一 :wi(g 一 1)), 如 果 ai* = 二 1 关 4* 一 0 
由 此 ,每 一 个 隐 层 神经 元 都 向 落 入 其 对 应 子 类 形成 的 类 的 向 量 靠 近 , 同 时 远离 落 入 其 他 类 
中 的 向 量 。 








7.3.7 案例 : 学 习 向 量 量化 解决 分 类 问题 


下 面 看 一 个 LVQ 训练 的 例子 。 如 图 7-56 所 示 ,我 们 训练 一 个 LVQ 网 络 ,解决 如 下 
分 类 问题 。 


class 1 可 [| = HE [he [i 


ee [of = = 
-ee 


下 一 步 须 决定 这 两 个 类 的 每 个 类 由 多 少 个 子 类 组 成 。 如 果 让 每 一 个 类 由 2 个 子 类 组 成 ， 
则 隐 层 有 4 个 神经 元 。 输 出 层 的 权 值 矩 阵 为 
ee ' 10 M4 
0011 

W? 将 隐 层 神经 元 1 和 2 与 输出 神经 元 1 相连 ,将 隐 层 神经 元 3 和 4 与 输出 神经 元 2 相 
连 。 每 个 类 将 由 2 个 凸 区 域 组 成 。 

Wi 的 行 向 量 被 随机 初始 化 。 如 图 7-57 所 示 ,空心 圆圈 表示 类 1 的 2 个 神经 元 的 权 
值 向 量 ,实心 圆 点 则 对 应 类 2 。 


Class 1 

















pe op 
pi9o Sp 
Class2 
图 7-56 LVQ 训练 的 例子 7-57 ”随机 初始 化 行 向 量 
权 值 如 下 。 


， 网 | E> | [ | Je 
1W 一 92 一 3W = mw 一 
0. 840 一 0.249 0. 094 0. 954 
训练 过 程 中 的 每 次 迭 代 均 会 输入 一 个 输入 向 量 , 获 得 其 响应 并 调整 权 值 。 在 本 例 中 ,将 
Ps 作为 第 一 个 输入 ,得 到 


务 7 葛 如 器 学 忆 一 人 369 一 一 一 





— | 1w'— ps 
oe — | ,wo—p;| 
a = compet(n' ) = compet 
二 上 二天 中 
一 二 pi 
一 [一 0.543 0.840] 一 [1 一 1]71 一 2.40 0 
二 | [一 0.969 一 0.249] 一 [1 2TH | db 一 2.11||_|。 
一 上 [5o.997 0.094] 一 [1 一 1]71 一 1.09 1 
一 外 [Co.456 0.954] 一 [1 一 1]51 一 2.03 0 


从 上 式 可 知 , 隐 层 的 第 3 个 神经 元 的 权 值 向 量 与 ps 最 接近 。 为 了 确定 该 神经 元 属于 哪个 
类 ,将 a! 与 W* 相 乘 ,得 





0 


1100]I0 0 
a 一 Wea! = = 
bn 


0 
该 结果 表明 向 量 p; 属于 类 2, 这 是 正确 的 ,于 是 更 新 ;w'! 使 其 向 ps 移动 。 
swW! (1)=sw! (0) 十 w(ps —w! (0)) 


[ooo os(| | [00 |)= 国光 | 

0.094 —1: Lo.o094 一 0.453 

图 7-58 中 的 左 图 显示 了 权 值 tw 在 第 一 次 迭代 之 后 的 更 新 结果 , 右 图 则 是 权 值 在 整个 算 
法 收敛 之 后 的 结果 。 


4 ba 
wl wl 
pi®! © p; pa ps 
. wl 
@p; pi Ps 
2 3 


图 7-58 第 一 次 和 多 次 和 迭代 之 后 











图 7-58 中 的 右 图 还 说 明了 输入 空间 区 域 是 如 何 被 分 类 的 。 图 中 , 含 空 心 点 区 域 代 表 
类 1 , 含 实心 点 区 域 对 应 类 2 。 


7.4 基于 统计 的 机 器 学 习 


7.4.1 支持 向 量 机 


支持 向 量 机 (Support Vector Machine, SVM) 建立 在 计算 学 习 理 论 的 结构 风险 最 小 
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化 原则 之 上 ,其 主要 思想 是 针对 两 类 分 类 问题 ,在 高 维 空间 中 寻找 一 个 超 平面 作为 两 类 的 
分 割 ,以 保证 最 小 的 分 类 错误 率 。SVM 的 一 个 重要 优点 是 可 以 处 理 线性 不 可 分 的 情况 。 
1. 线性 可 分 模式 的 最 优 超 平面 
考虑 训练 样本 { (x;,d;)) 六 1 ,其 中 x; 是 输入 模式 的 第 i 个 样本 ,d; 是 对 应 的 期 望 响应 
(目标 输出 )。 首 先 假设 由 子 集 di 二 十 1 代表 的 模式 (类 ) 和 ;二 一 1 代表 的 模式 (类 ) 是 
“线性 可 分 的 "(linearly separable)。 用 于 分 离 的 超 平面 形式 的 决策 面 是 
wix+b=0 (7-51) 
其 中 ,x 是 输入 向 量 ,w 是 可 调 的 权 值 向 量 ,5b 是 偏 置 。 因 此 可 以 写成 
WwWIxi 十 0 二 0 当 4d; = 十 1 
wixi+b<=0 当 d; = 一 1 (7-52) 
在 这 里 做 了 模式 线性 可 分 的 假定 ,以 便 在 相当 简单 的 环境 里 解释 支持 向 量 机 背后 的 基本 
思想 。 
对 于 一 个 给 定 的 权 值 向 量 w 和 偏 置 2, 由 式 (7-51) 定 义 的 超 平面 和 最 近 的 数据 点 之 
间 的 间隔 被 称 为 分 离 边缘 ,用 po 表示。 支持 向 量 
机 的 目标 是 找到 一 个 特殊 的 超 平面 ,对 于 这 个 
超 平面 分 离 边缘 p 最 大 。 在 这 个 条 件 下 ,决策 面 
称 为 最 优 超 平面 (optimal hyperplane)。 图 7-59 
描绘 的 是 用 于 线性 可 分 模式 的 最 优 超 平面 。 
设 w 、bo 表示 权 值 向 量 和 偏 置 的 最 优 值 。 
相应 地 ,在 输入 空间 里 表示 多 维 线性 决策 面 的 
最 优 超 平面 由 式 (7-53) 定 义 。 
WoTx 十 po 一 0 (7-53) 
式 (7-53) 是 式 (7-51) 的 改写 。 判 别 函数 
g(Zz) 一 WoIY 十 bo (7-54) 
给 出 了 从 x 到 最 优 超 平面 的 距离 的 代数 度量 。 
看 出 这 一 点 的 最 简单 方法 是 将 x 表达 为 图 7-59 用 于 线性 可 分 模式 的 最 优 超 平面 








2 Wo 
a 


其 中 ,xy 是 x 在 最 优 超 平面 上 的 正 轴 投影 ,并 且 r 是 期 望 的 代数 距离 ;如 果 x 在 最 优 超 平面 
的 正面 ,r 是 正 值 ; 相 反 ,如 果 x 在 最 优 超 平面 的 背面 ,r 是 负 值 。 因 为 由 定义 知 g (x) 二 0， 
那么 
g(x) = wix+bo =rlw | 
或 者 
r= g(x)/ | wl (7-55) 

如 图 7-60 所 示 , 从 原点 ( 即 x 二 0) 到 最 优 超 平面 的 距离 由 56/ | wo | 给 定 。 如 果 如 过 
0, 原 点 在 最 优 超 平面 的 正面 ;如 果 6 二 0, 原 点 在 最 优 超 平面 的 背面 ;如 果 b 二 0, 最 优 超 
平面 通过 原点 。 

现在 的 问题 是 对 于 给 定 的 数据 集 本 =={(x;,d;)) 六 1 ,找到 最 优 超 平面 的 参数 w 和 加。 
根据 图 7-60 描绘 的 结果 ,可 以 看 到 一 对 (wo , bo ) 一 定 满足 条 件 : 
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最 优 超 平面 








O ed 
图 7-60 二 维 情况 下 点 到 最 优 超 平面 的 代数 距离 的 几何 解释 


Wxi 十 bo 宇 1， 当 d; = 十 1 
Wx 十 bo 二 一 1， 当 4d; = 一 1 
注意 ,如 果 式 (7-52) 成 立 , 即 模式 是 线性 可 分 的 ,总 可 以 重新 调整 w 和 6b。 的 值 ,使 得 式 
(7-56) 成 立 ; 这 种 重新 调整 并 不 改变 式 (7-53)。 
满足 式 (7-56) 第 一 行 或 第 二 行 等 号 情况 的 特殊 数据 点 (xi,d;) 称 作 支持 向 量 , “支持 
向 量 机 ”因此 得 名 。 这 些 向 量 在 这 类 学 习 机 器 的 运行 中 起 着 主导 作用 。 用 概念 性 的 术语 
说 ,支持 向 量 是 那些 最 靠近 决策 面 的 数据 点 ,这 样 的 数据 点 是 最 难 分 类 的 。 因 此 ,它们 和 
决策 面 的 最 优 位 置 直接 相关 。 
假定 一 个 支持 向 量 x 对 应 于 d” = 十 1。 然 后 根据 定义 ,得 出 
g(xX?) = 二 Mx 十 bo = 土 ]， 当 d = 土 1 (7-57) 
从 式 (7-55) 知 从 支持 向 量 x 到 最 优 超 平面 的 代数 距离 是 
r= g(x°)/ | wo 
他 | wo ll 当 d® = 十 1 


(7-56) 


(7-58) 
一 Ilwl 当 d® = 一 1 


其 中 ,加 号 表示 x 在 最 优 超 平面 的 正面 , 减 号 表示 x” 在 最 优 超 平面 的 背面 。 让 p 表示 
在 两 个 类 之 间 的 分 离 边界 的 最 优 值 ,其 中 这 两 个 类 构成 训练 集合 P。 因 此 ,从 式 (7-58) 
得 到 
p=2r=2/| wl (7-59) 
式 (7-59) 说 明 : 最 大 化 类 之 间 的 分 离 边 缘 等 同 于 最 小 化 权 值 向 量 w 的 欧 几 里 得 范 数 。 
总 之 ,由 式 (7-53) 定 义 的 最 优 超 平面 是 唯一 的 ,最 优 权 值 向 量 w 提供 了 正 反例 之 间 
的 最 大 可 能 的 分 离 。 这 个 优化 的 条 件 是 通过 权 值 向 量 w 的 最 小 欧 几 里 得 范 数 获得 的 。 
寻找 最 优 超 平面 的 二 次 最 优化 如 下 。 
我 们 的 目标 是 设计 一 个 有 效 的 程序 ,通过 使 用 训练 样本 本 =={(x;,d;)}X ,找到 最 优 
超 平面 ,并 且 满 足 约束 条 件 
di(wixi+b)1 当 i=1,2,……,N (7-60) 
这 个 约束 把 式 (7-56) 的 两 行 连 到 一 起 ,w 被 w 代替 。 
我 们 必须 解决 的 约束 最 优 问题 现在 可 陈述 如 下 。 
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给 定 训练 样本 {(x;,d;)}&&1 ,找到 权 值 向 量 w 和 偏 置 2 的 最 优 值 ,使 得 它们 满足 下 面 

的 约束 条件 。 
di(w'ixi 二 +b) 宇 1 当 i=1,2,…,N 
并 且 权 值 向 量 w 的 最 小 化 代价 函数 : 
Bw) = (1/2) X wIw 

这 里 包含 比例 因子 1/2 是 为 了 讲解 方便 。 这 个 约束 优化 问题 称 为 原 问 题 (primal 
problem) ,其 特点 : 代价 函数 B(w) 关 于 w 是 是 函数 ; @ 限 制 条 件 关 于 w 是 线性 的 。 相 
应 地 ,可 以 使 用 Lagrange 乘 子 方法 解决 约束 最 优 问 题 。 

首先 ,建立 Lagrange 函数 : 


J wbra) = 二 Ww 3 [di (wTxi tb) —1] (7-61) 


其 中 附加 的 非 负 变量 a; 称 作 Lagrange 乘 子 。 约束 最 优 问题 的 解决 由 Lagrange 函数 
JCw, ba) 的 鞍点 决定 ,此 函数 关于 w 和 6。 求 最 小 化 ,关于 a 求 最 大 化 。J (w, 5b, a) 关 于 
w 和 6。 求 微分 并 置 结果 等 于 零 ,我 们 得 到 下 面 两 个 最 优化 条 件 。 

条 件 1: 9J(w,b,a)/9w 二 0 

条 件 2: 9J (w,b,a)/95 二 0 
应 用 最 优化 条 件 1 到 式 (7-61) 的 Lagrange 函数 得 到 (在 重新 安排 项 之 后 ) 


w= > audixi (7-62) 
应 用 最 优化 条 件 2 到 式 (7-61) 的 Lagrange 函数 得 到 


N 


Zed =0 (7-63) 


解 向 量 w 定义 为 N 个 训练 样本 的 展开 。 注意 ,尽管 这 个 解 是 唯一 的 ,这 由 Lagrange 函数 
的 凸 性 的 本 质 决 定 , 但 并 不 能 认为 Lagrange 函数 的 系数 w 也 是 唯一 的 。 
在 这 里 同样 值得 提 到 的 是 ,在 鞍点 对 每 一 个 Lagrange 乘 子 w ,与 它 相 应 的 限制 乘 子 
的 积 为 零 , 如 下 式 所 示 。 
uaLdi(wru 十 0 一 1] 三 0 i=1,2,%,N (7-64) 
此 ,只 有 这 些 精 确 满足 式 (7-64) 的 乘 子 , 才 能 假定 非 零 值 。 这 个 结果 是 从 最 优化 理论 
Kanush-Kuhn-Tucker 条 件 得 出 的 
就 像 早 先 提 到 的 , 原 问题 是 处 理 凸 代价 函数 和 线性 约束 。 给 定 这 样 一 个 约束 最 优化 
问题 , 它 可 能 构造 男 一 个 问题 , 称 为 对 偶 问 题 。 这 个 第 二 个 问题 与 原 问 题 有 同样 的 最 优 
值 ,但 由 Lagrange 乘 子 提供 最 优 解 。 特 别 地 ,可 以 陈述 对 偶 定理 如 下 。 
(a) 如 果 原 问题 有 最 优 解 ,对 偶 问题 也 有 最 优 解 ,并且 相应 的 最 优 值 是 相同 的 。 
(b) 为 了 使 得 w 为 原 问题 的 一 个 最 优 解 和 ao 为 对 偶 问题 的 一 个 最 优 解 的 充分 必要 
条 件 是 w 对 原 问 题 是 可 行 的 ,并 且 
DWo) = Two ,bo sa0) 一 miny] (w,bo ,ao) 
为 了 说 明 对 偶 问 题 是 原 问题 的 必要 条 件 . 首 先 逐 项 展开 式 (7-61) 如 下 。 


J(w,b,a) = 一 ea 二 ode + he (7-65) 
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按照 式 (7-63) 最 优 条 件 的 性 质 , 式 (7-65) 右 面 的 第 三 项 是 零 。 而 且 从 式 (7-62) 有 


N N N 
wiw = Dadiw x = 2) Daadid xlx; 
i=1 


iml j=l 


因此 ,目标 函数 设置 为 J(w,5b,a) 一 Q(a) ,可 以 改写 式 (7-66) 。 


N 得 N N 
Qa) = Da = DaiasdidjxTx; (7-66) 
iml 


其 中 ,a; 是 非 负 的 。 
下 面 陈述 对 偶 问题 。 
假定 训练 样本 {(xi,d;)) 六 1 ,寻找 最 大 化 如 下 目标 函数 的 Lagrange 乘 子 {ci ) 福 : ; 
Q(a) = pe 一 二 > Daadid xTx; 


i=1 j=!1 


满足 约束 条 件 
(1) 2 ad = 0。 


(2) @ 宇 0 当 i=1,2,3,…,N 时 

注意 ,对 偶 问题 完全 是 根据 训练 数据 表达 的 ,而 且 函 数 Q(a) 的 最 大 化 仅 依赖 于 输入 
模式 点 积 的 集合 { (xTx;)) 六 -1。 

确定 了 最 优 的 Lagrange 乘 子 后 ,用 ao.; 表 示 , 可 以 用 式 (7-62) 计 算 最 优 权 值 向 量 w， 
所 以 


Ns 
Wo = Dy aodix: (7-67) 
i=l] 


其 中 ,NN, 是 支持 向 量 的 个 数 。 为 了 计算 最 优 偏 置 ,使 用 获得 的 w ,对 于 一 个 正 的 支持 
向 量 , 利 用 式 (7-57) ,有 
和 一 1 一 Wixo, 当 de 一 1 时 (7-68) 
2. 不 可 分 离 模式 的 最 优 超 平面 
前 面 重点 关注 线性 可 分 模式 的 情况 。 下 面 考虑 更 难 的 不 可 分 离 模式 的 情况 。 给 定 一 
组 训练 数据 集 ,肯定 不 能 建立 一 个 不 具有 分 类 误差 的 分 离 超 平面 。 然 而 ,我 们 和 希望 找到 一 
个 最 优 超 平面 , 它 对 整个 训练 集合 的 分 类 误差 的 概率 达到 最 小 。 
在 类 之 间 的 分 离 边缘 认为 是 软 的 ,如 果 数 据点 (x;,d;) 不 满足 下 面 的 条 件 ( 即 
式 (7-60)): 
di(wixit+b) 21, i=1,2,,N 
会 出 现 如 下 两 种 情况 之 一 。 
。 数据 点 (xi ,di) 落 在 分 离 区 域 之 内 ,但 在 决策 面 正 确 的 一 侧 , 如 图 7-61(a) 所 示 。 
。 数据 点 (xi ,di) 落 在 决策 面 错误 的 一 侧 , 如 图 7-61(b) 所 示 。 
注意 ,在 情况 1 我 们 有 正确 的 分 类 ,但 在 情况 2 分 类 是 错误 的 。 
为 了 对 不 可 分 离 数 据点 给 出 一 个 正式 处 理 的 表示 ,我 们 引入 一 组 新 的 非 负 标量 变量 
{ 科 :到 分 离 超 平面 ( 即 决策 面 ) 的 定义 中 ,表示 为 
di(Wwixit+D) 1—&, i=1,2,…,N (7-69) 
这 里 ,& 称 为 松弛 变量 (slack variables) ,它们 度量 一 个 数据 点 对 模式 可 分 的 理想 条 件 的 
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(a) 数据 点 落 在 决策 面 正 确 的 一 侧 (b) 数据 点 落 在 决策 面 错误 的 一 侧 
图 7-61 软 分 离 边缘 平面 


偏离 程度 。 对 于 0<& 夺 1, 数据 点 落 和 人 分离 区 域 的 内 部 ,但 是 在 决策 面 的 正确 一 侧 , 如 
图 7-61(a) 所 示 。 对 于 和 二 1, 数 据点 落 到 分 离 超 平面 的 错误 一 侧 , 如 图 7-61(b) 所 示 。 支 
持 向 量 是 那些 精确 满足 式 (7-69) 的 特殊 数据 点 ,即使 $ 二 0。 此 外 ,满足 =0 的 点 也 是 
支持 向 量 。 注 意 ,如 果 一 个 对 应 的 样本 二 0 被 遗弃 在 训练 集 外 ,决策 面 就 要 改变 。 支 持 
向 量 的 定义 对 线性 可 分 和 不 可 分 的 情况 都 是 相同 的 。 

我 们 的 目的 是 找到 分 离 超 平面 ,训练 集合 上 的 平均 错误 分 类 的 误差 最 小 。 可 以 通过 
最 小 化 关于 权 值 向 量 w 泛 函 达 到 此 目的 。 

$B(E) = Se 

泛 函 满足 式 (7-69) 的 约束 条 件 和 对 ew :的 限制 。 函 数 1(&) 是 一 个 指标 函数 ,定义 为 
0, é€<0 
PE 
不 幸 的 是 ,@(5 关 于 w 的 最 小 化 是 非 凸 的 最 优化 问题 , 它 是 NP- 完 全 的 。 

为 了 使 最 优 问题 数学 上 易 解 ,我 们 近似 副 近 函 数 为 


1(8 = | 


$8) = Dé 
i=l 
而 且 我 们 通过 形成 关于 权 值 向 量 w 如 下 最 小 化 函数 ,以 简化 计算 , 即 
G(w,6) = ww+ Ce (7-70) 


如 前 , 式 (7-70) 里 最 小 化 第 1 项 与 最 小 化 支持 向 量 机 的 VC 维 数 有 关 。 至 于 第 2 项 >,é;， 
它 是 测试 错误 数量 的 上 界 。 

参数 C 控制 机 器 的 复杂 度 和 不 可 分 离 点 数 之 间 的 平衡 ;这 样 , 它 也 可 以 被 看 作 是 一 
种 “正则 化 ”参数 的 形式 。 参 数 C 由 用 户 指定 ,也 可 通过 使 用 训练 (验证 ) 集 由 实验 决定 。 

无 论 哪 种 情况 , 泛 函 @(w,5 关 于 w 和 {&) 六 1 的 最 优化 ,要 求 满足 式 (7-69) 的 约束 和 
和 三 0。 这 样 做 ,w 的 范 数 平方 被 认为 是 一 个 关于 不 可 分 离 点 的 联合 最 小 化 中 的 一 个 数量 
项 ,而 不 是 作为 强加 在 关于 不 可 分 离 点 数量 的 最 小 化 上 的 一 个 约束 条 件 。 

对 刚刚 陈述 的 不 可 分 模式 的 最 优化 问题 而 言 ,线性 可 分 模式 的 最 优化 问题 可 作为 它 
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的 一 种 特殊 情况 。 具 体 地 ,在 式 (7-69) 和 式 (7-70) 中 ,对 所 有 的 i 置 &; 二 0, 把 它们 化 简 为 
相应 的 线性 可 分 情形 。 

现在 对 不 可 分 离 的 情况 的 原 问题 正式 陈述 如 下 。 

给 定 训 练 样本 {(xi ,di) } ,找到 权 值 向 量 w 和 偏 置 2 的 最 优 值 ,使 得 它们 满足 如 下 
约 东 条件 : 


di(Wizit+D) 1 i=1,2,,N (7-71) 
各 过 0 ”对 所 有 的 i (7-72) 
并 且 使 得 权 值 向 量 w 和 松弛 变量 &; 最 小 化 代价 函数 
Bw 一 了 ww 十 C>)5 (7-73) 
其 中 ,C 是 用 户 选 定 的 正 参数 。 


使 用 Lagrange 乘 子 方法 ,可 以 得 到 不 可 分 离 模 式 的 对 偶 问 题 的 表示 如 下 。 
给 定 训练 样本 {(x;,d;)) 六 1, 寻找 Lagrange 乘 子 {a;) 六 最 大 化 目标 函数 
Qa) = Da 一 立 ， Daasdidjx Ix; (7-74) 


i=!1 


并 满足 约束 条 件 
(1) Dad; = 0 


(2) 0<a<C 当 i=1,2,3,°%,N 

其 中 ,C 是 使 用 者 选 定 的 正 参数 。 

注意 ,松弛 变量 和 它们 的 Lagrange 乘 子 都 不 出 现在 对 偶 问题 里 。 除 了 一 些 少量 
但 很 重要 的 差别 外 ,不 可 分 离 模式 的 对 偶 问题 与 线性 可 分 模式 的 简单 情况 相似 。 在 两 种 
情况 下 ,最 大 化 的 目标 函数 Q(a) 是 相同 的 。 不 可 分 离 情 况 与 可 分 离 情 况 的 不 同 在 于 限制 
条 件 a; 三 0 被 替换 为 条 件 更 强 的 0<a; 三 C。 除 了 这 个 变化 ,不 可 分 离 的 情况 的 约束 最 优 
问题 和 权 值 向 量 w 和 偏 置 2 的 最 优 值 的 计算 过 程 与 线性 可 分 离 情 况 的 一 样 。 

3. 用 于 模式 识别 的 支持 向 量 机 的 潜在 思想 

有 了 关于 对 不 可 分 离 模 式 如 何 找 到 最 优 超 平面 的 知识 后 ,现在 正式 描述 建立 用 于 模 
式 识 别 任务 的 支持 向 量 机 。 

从 根本 上 说 ,支持 向 量 机 的 关键 在 于 如 图 7-62 中 说 明和 总 结 的 两 个 数学 运算 : 

(1) 输入 向 量 到 高 维特 征 空间 的 非 线 性 映射 ,对 输入 和 输出 特征 空间 都 是 隐藏 的 。 

(2) 建立 一 个 最 优 超 平 面 用 于 分 离 在 第 1 步 中 发 现 的 特征 。 

4. 使 用 核 方 法 的 支持 向 量 机 

令 x 表 示 从 输入 空间 得 到 的 向 量 , 假 定 维 数 为 mo。 令 {gp; (Cr))P 表 示 一 系列 从 输入 
空间 到 特征 空间 的 一 个 非 线 性 函数 的 集合 ,其 中 m 是 特征 空间 的 维 数 。 给 定 非 线性 变 
换 的 一 个 集合 ,可 以 定义 一 个 充当 决策 面 的 超 平面 如 下 。 


ks 


> rwpiCr) 十 0 一 0 


其 中 , (ww) 名 ,表示 把 特征 空间 连接 到 输出 空间 的 线性 权 值 的 集合 ,6 是 偏 置 。 可 以 将 上 
式 简 化 为 
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这 一 点 属于 了 





输入 (数据 ) 输出 空间 





特征 (隐藏 空间 
图 7-62 从 输入 空间 到 特征 空间 的 非 线性 映射 


| 
2) gji(z) 一 0 (7-75) 


其 中 假定 对 所 有 的 x, 都 有 go (xz) 二 1, 所 以 wo 表示 偏 置 0。 式 (7-75) 定 义 了 一 个 决策 面 ， 
这 个 决策 面 在 特征 空间 根据 机 器 的 线性 权 值 进行 计算 。 通 过 特征 空间 ,w(xr) 表 示 提 供给 
权 值 zw 的 输入 。 
使 用 矩阵 的 观点 , 重 写 等 式 为 如 下 紧凑 形式 。 
wig(x)=0 (7-76) 

其 中 ,p(x) 是 特征 向 量 ;w 是 相应 的 权重 向 量 。 

我 们 试图 寻找 在 特征 空间 中 “转化 后 模式 的 线性 可 分 性 ”, 带 着 这 个 目标 ,可 以 将 式 
(7-67) 的 形式 用 权重 向 量 改 写成 下 列 形式 。 


N, 
w= Dadip xi) fv, 
i=] 
其 中 ,特征 向 量 表 示 为 
9(z;) = [go xi) ,pi (zi) ss pm (zi) 相 (7-78) 
N, 是 支持 向 量 的 个 数 。 所 以 ,把 式 (7-76) 代 入 式 (7-77) 中 ,将 输出 空间 中 的 决策 面 表 
示 为 
N, 
Dadip T(x)9(x) =0 (7-79) 
i=1 
注意 , 式 (7-79) 中 的 pT(x;)p(x) 代 表 一 个 内 积 。 这样 ,引入 内 积 核 (inner-product 
kernel) ,由 k(x,x;) 表 示 并 且 定 义 为 
k(x,xi) = 9 (xi)p(x) 


= Dp pr) i=1,2,.,N, (7-80) 
由 该 定义 可 以 看 到 内 积 核 是 一 个 关于 自 变 量 对 称 的 函数 。 


务 7 冯 加 加 学 一 航 各 和 一 一 
k(xsxi) 二 k(xi,x) ”对 所 有 的 i (7-81) 
最 重要 的 是 ,可 以 使 用 内 积 核 &(x,x;) 在 特征 空间 里 建立 最 优 超 平面 ,无 须 用 显 式 的 形式 
考虑 特征 空间 自身 。 将 式 (7-80) 代 入 到 (7-79) 中 可 以 看 到 这 一 点 ,此 时 最 优 超 平面 定 
义 为 
Ni， 
Daidik (x,xi) 一 0 (7-82) 
Mercer 定理 
式 (7-80) 对 于 内 积 核 函 数 k(x,x;) 的 扩展 是 Mercer 定理 在 泛 函 分 析 中 的 一 种 特殊 
情形 。 这 个 定理 可 以 被 正式 表述 为 如 下 形式 。 
k(x,x') 表 示 一 个 连续 的 对 称 核 函 数 ,其 中 工 与 x' 定 义 在 闭 区 间 a 二 +b,a<x <b。 
核 函数 k(x,x ) 可 以 被 展开 为 如 下 形式 。 
(Ry 三 六 MipiCr)GiCx ) 
其 中 所 有 的 7; 均 是 正 的 。 为 了 保证 这 个 展开 式 是 合理 的 ,并 且 为 绝对 一 致 收敛 , 充 
分 必要 条 件 是 : 
『 | eeszowcowzoardx >0 
对 于 所 有 %(。) 成 立 ,这 样 就 有 
| 六 (Zz)dr 二 吕 成 立 , 其 中 a。 是 实数 。 
函数 gp;(x) 称 为 展开 的 特征 函数 ,4; 称 为 特征 值 。 所 有 的 特征 值 均 为 正 数 , 这 个 事实 意味 
着 核 函数 k(x,x ) 是 正定 的 。 
5. 支持 向 量 机 的 设计 
式 (7-80) 里 内 积 核 函 数 k(x,x;) 的 展开 式 允 许 我 们 建立 一 个 决策 面 ,在 输入 空间 中 
是 非 线 性 的 ,但 它 在 特征 空间 的 像 是 线性 的 。 有 了 这 个 展开 式 , 可 以 对 支持 向 量 机 的 约束 
最 优化 的 对 偶 形 式 陈述 如 下 。 
给 定 训 练 样本 {(x;,d;)) 六 ,寻找 Lagrange 乘 子 {a 六 ,以 最 大 化 目标 函数 
a 一 记 > Dag da ty (7-83) 


i=1 j=1 


满足 约束 条 件 
《入 Dad, = 0; 
i=1 

(2) 0<w<C 当 i=1,2,3,.…,N 

其 中 ,C 是 使 用 者 选 定 的 正 参数 。 
注意 ,约束 条 件 (1) 由 LagrangeQ(a) 关 于 go (x) 二 1 时 偏 置 5 二 wo 的 最 优化 产生 。 这 里 陈 
述 的 对 偶 问题 与 上 面 考虑 的 不 可 分 离 模式 情况 的 形式 相同 。 事 实 上 , 除 内 积 xz;Tz; 被 内 
积 核 函数 k(x;,x;) 代 蔡 外 ,我们 可 以 把 k(x;,x;) 看 作 是 NXN 的 对 称 和 矩阵 K 的 第 订 项 元 
素 ,如 下 所 示 。 

KK Gri (7-84) 

找到 由 wm,; 表 示 Lagrange 乘 子 的 最 优 值 之 后 ,可 以 得 到 相应 的 线性 权 值 向 量 最 优 值 w ， 
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在 新 的 情况 下 , 它 采 用 式 (7-67) 联 系 特征 空间 到 输出 空间 。 特 别 地 ,考虑 到 像 PCzi) 在 从 
输入 到 权 值 向 量 w 的 作用 ,我 们 可 以 定义 w 为 
wo = Daoidip xi) (7-85) 
其 中 ,p(Czi) 是 z; 在 特征 空间 导出 的 像 。 注 意 ,w 的 第 一 个 分 量 表示 最 优 偏 置 b。。 
以 下 给 出 支持 向 量 机 的 示例 。 
核 函 数 k(zx,z;) 的 要 求 是 满足 Mercer 定理 。 只 要 满足 这 个 要 求 ,怎样 选 择 它 是 有 一 
定 自由 度 的 。 表 7-4 总 结 了 支持 向 量 机 的 3 个 常用 的 内 积 核 函 数 : 多 项 式 学 习 机 器 、 径 





向 基 郴 数 网 络 和 双 层 感知 器 。 
表 7-4 Mercer 核 总 结 
支持 向 量 机 种 类 Mercer 核 k(x,xi) 说 明 
多 项 式 学 习 机 器 (ETRE 使 用 者 预先 指定 指数 p 





和 向 基 丽 数 网 络 。 | exp( 一 地 1x 一 上”) | 和 所 有 核 一 样 ,由 使 用 者 指定 宽度 











双 层 感知 器 tanh(BxT™xi+tB) 只 有 一 些 特定 的 局 .Bi 值 满足 Mercer 定理 


图 7-63 给 出 了 一 种 支持 向 量 机 的 体系 结构 ,其 中 ,m 是 隐藏 层 的 大 小 (如 特征 空间 ) 。 
偏 置 b 





论 入 向 量 x< 四 由 








大 小 为 mo 的 输入 层 mm 个 内 积 核 的 特征 层 


图 7-63 支持 向 量 机 结构 


7.4.2 案例 : XOR 问题 


为 了 说 明 支 持 向 量 机 设计 过 程 ,我 们 讨论 XOR( 异 或 ) 问 题 。 表 7-5 结 出 了 4 种 可 能 
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的 输入 向 量 及 其 期 望 的 响应 。 
表 7-5 XOR 问题 

输入 向 量 x 期 望 的 响应 4 

(1 一 1 

《一 而 寺 下 3 

(十 1, 一 了 本 

(+1,+D 一 1 
我 们 定义 如 下 核 。 

k(xsxi) 一 (1 十 xTxi)2 (7-86) 


令 x=[zz] 和 x 二 [xa ,zaj] ,因而 内 积 核 R(x,x;) 可 用 不 同 次 数 的 单项 式 表示 
如 下 。 
k(x1oxi) = 1 zizh 2rirrare tt xixg + 2riza + 2r2xi 
输入 向 量 z 在 特征 空间 中 映射 的 像 可 推断 为 
9(x) = [1,z? WW2 XiT2 Tt NZI Np 
类 似 地 ， 
px) = [1,2 ,V2 zxazes zh Vra VIza] ,i=1,2,3,4 
由 式 (7-84) ,得 到 Gram 矩阵 
9 1 

站 = 1 9 
1 1 
| 


局 二: Es : 避 
DO 


因此 ,目标 函数 的 对 偶 形 式 为 (参看 式 (7-83)) 


Q(a) 一 al 十 az 十 as 十 oa 一 于 Codi 一 2aia: 一 2aias 十 2aia 十 9a; 十 


2azas 一 2aza 十 9a3 一 2asa 十 9ai) 
关于 Lagrange 乘 子 优化 Q(a) 产 生 下 列 联 立方 程 组 。 








9a—as—ast+a=l 
一 al 十 9a: 一 as 一 a% 一 1 
一 al 十 十 9as 十 a 三 1 
al 一 az 一 as 十 9aw 一 1 
因此 ,Lagrange 乘 子 的 最 优 值 为 
0.1 一 Co 一 A0.3 二 0.4 一 诗 
这 个 结果 说 明 ,在 这 个 例子 中 所 有 4 个 输入 向 量 {x;}-; 都 是 支持 向 量 ,Q(a) 的 最 优 值 是 
Qe = 工 


相应 地 ,可 写 出 
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去 1 wl?= 十 
或 者 

至 
VE 


| wl = 
从 式 (7-85) 可 以 找到 最 优 权 值 向 量 


Wo 一 二 [一 (x) ox) + p(x) — p(x)] 


1 1 1 1 
| 1 1 1 
1 V2 —V2 一 2 V2 
三 .村 | | 1 1 | |1 
一 民 一 \Z V2 V2 
一 V2 V2 —V2 2 
0 
0 
| 一 LA 
攻 0 
0 
0 
wo 的 第 一 个 分 量 表示 偏 置 5 为 0。 
最 优 超 平 面 定 义 为 
wip(x)=0 
1 
zi 
一 1 Mizs 
即 E 0 00 "| 
2 2 
Vax 
V2zxz 


这 归结 为 一 zizz 一 0 

对 于 XOR 问题 的 多 项 式 形式 的 支持 向 量 机 ,可 以 参见 图 7-64(a)。 对 zi 二 zs 二 一 1 和 
Zl 二 Xs 三 十 1, 输 出 y= 一 1; 对 z= 二 一 1,zx2s = 二 十 1 以 及 z= 二 十 1,zxs= 二 一 1, 输 出 y= 十 1。 
因此 ,如 图 7-64(b) 所 示 ,XOR 问题 被 解决 了 。 





7.4.3 统计 关系 学 习 


传统 机 器 学 习 模 型 假设 数据 是 独立 同 分 布 的 (independent and identically 
distributed，iid) 。 然 而 ,在 很 多 实际 应 用 中 ,尤其 是 像 Facebook、 微 信和 微 博 这 种 社交 网 
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1.09 (1L-D 
Xl CD 





pa of 决策 边界 
-1.09 (1,1) 

了 Cl) 

(外 多 项 式 核 机 器 解决 XOR 问题 (b) 由 XOR 问题 的 4 个 点 推导 出 的 特征 空间 的 像 


7-64 XOR 问题 


络 应 用 中 ,数据 样本 之 间 是 有 关系 的 ,样本 之 间 是 不 独立 的 。 例 如 ,互联 网 上 网 页 之 间 存 
在 超 链 接 关 系 ,学 术 论 文 之 间 存在 引用 关系 ,社交 网 络 中 的 对 象 之 间 存 在 各 种 各 样 的 关 
系 , 人 与 人 之 间 存 在 着 通信 关系 ,蛋白 质 之 间 存 在 各 种 交互 关系 。 我 们 把 这 种 样本 之 间 存 
在 关系 的 数据 叫 作 关系 数据 (relational data) ,把 基于 关系 数据 的 机 器 学 习 叫 作 统计 关系 
学 习 (Statistical Relational Learning，SRL) 。 由 于 关系 数据 在 互联 网 数据 挖掘 .社交 网 
络 分 析 、\ 生 物 信息 学 .经济 学 ` 恐 怖 和 恶意 行为 预测 以 及 市 场 营 销 等 各 个 领域 不 断 涌现 , 统 
计 关 系 学 习 已 经 成 为 一 个 具有 重要 科学 意义 和 应 用 价值 的 研究 课题 。 

目前 主流 的 统计 关系 学 习 方法 可 以 大 致 分 为 以 下 5 类 : 基于 个 体 推理 模型 的 方法 
(IIM) 、 基 于 启发 式 联合 推理 的 方法 (HCD 、 基 于 概率 关系 模型 的 方法 (PRMs) ,基于 概率 
逻辑 模型 的 方法 (PLMs) ,以 及 基于 隐 因 子 模型 的 方法 (LFMs)。 

IIM 方法 从 关系 信息 中 抽取 出 特征 ,并 将 关系 数据 转化 成 适合 传统 机 器 学 习 算法 的 
特征 向 量 形式 ,然后 用 传统 学 习 算法 进行 分 类 。 由 于 IIM 方法 忽略 了 关系 数据 中 样本 之 
间 的 相关 性 ,分 类 性 能 往往 比较 差 。 另 外 ,这 类 模型 主要 用 于 分 类 任务 ,而 不 适合 于 链接 
预测 等 其 他 统计 关系 学 习 任 务 。 因 此 ,IIM 方法 实用 性 不 是 很 强 。 

HCI 方 法 利用 有 关系 的 样本 之 间 的 相关 性 ,采用 启发 式 的 循环 迭代 方式 对 多 个 样本 
同时 进行 分 类 。 由 于 考虑 了 有 关系 的 样本 之 间 的 相关 性 ,这 类 方法 在 实际 应 用 中 取得 了 
比 IIM 方法 更 好 的 分 类 性 能 。 但 是 ,HCI 方法 主要 用 于 联合 分 类 ,而 不 适合 于 其 他 统计 
关系 学 习 任 务 。 因 此 ,HCI 方 法 的 实用 性 也 比较 有 限 。 

PRMEs 方法 通过 拓展 传统 的 图 模型 对 样本 之 间 的 相关 性 进行 建 模 。 典 型 的 PRMs 
包括 关系 型 贝 叶 斯 网 络 (RBNs)、 关 系 型 马尔 可 夫 网 络 (RMNs) 和 关系 型 依赖 网 络 
(RDNs)。PRMs 方法 从 概率 统计 角度 对 关系 数据 进行 建 模 ,能 很 好 地 处 理 不 完整 和 不 精 
确 数据 。 但 是 ,学 习 一 个 图 模型 需要 进行 结构 学 习 和 参数 学 习 。 结 构 学 习 是 对 变量 之 间 
的 各 种 依赖 关系 进行 确定 ,是 一 个 组 合 优化 问题 ,因此 复杂 度 非常 高 。 另 外 ,RMNs 和 
RDNs 的 参数 学 习 也 没有 收敛 和 快速 的 方法 ,实际 应 用 中 往往 采用 一 些 近似 的 逼近 策略 。 
因此 ,PRMs 方法 的 一 个 主要 缺点 是 学 习 速 度 慢 ,只 适合 于 小 规模 数据 的 处 理 。 

概率 逻辑 模型 PLMEs 将 概率 引进 一 阶 谓 词 逻辑 ,能 够 很 好 地 对 关系 数据 进行 建 模 。 
代表 性 的 PLMs 有 概率 Horn 溯 因 (PHA)、 贝 叶 斯 逻辑 编程 (BLP) 马尔 可 夫 逻 辑 网 络 
(MLNs)。PLMs 的 底层 建 模 工具 还 是 基于 图 模型 ,因此 PLMs 方法 也 具有 PRMs 方法 
的 学 习 速 度 慢 的 缺点 ,只 适合 于 小 规模 数据 的 处 理 。 





一 一 一 382 


人 工大 能 ( 荔 3 瞩 ) 


LFMs 方法 将 统计 学 中 的 隐 因 子 模型 引进 统计 关系 学 习 。 其 中 ,常用 的 矩阵 分 解 算 
法 对 应 于 某 个 LFM 的 一 个 最 大 似 然 估 计 或 者 最 大 后 验 估计 。 因 此 ,和 矩阵 分 解 方 法 可 以 
看 成 LFMs 的 一 种 特例 。 大 部 分 LFMs 方法 具有 相对 于 观察 到 的 链接 数 的 线性 复杂 度 ， 
学 习 速 度 远 远 超过 PRMs 方法 和 PLMs 方法 ,能 很 好 地 对 较 大 规模 数据 进行 建 模 。 因 
此 ,包括 矩阵 分 解 这 个 特例 在 内 的 LFMs 方法 已 经 发 展 成 为 目前 统计 关系 学 习 算法 的 主 
流 ,具有 比 其 他 方法 更 广阔 的 应 用 前 景 。 

近年 来 ,大 数据 应 用 中 的 关系 数据 呈现 出 下 面 两 个 特性 : 中 动态 性 : 数据 是 随 着 时 
间 的 推移 不 断 变化 的 ,例如 ,在 一 个 社交 网 络 中 , 随 着 时 间 的 推移 ,可 能 有 成 员 退 出 ,也 可 
能 有 新 成 员 加 入 ; 四 海量 性 : 随 着 数据 采集 设备 自动 化 程度 的 不 断 提高 ,很 多 应 用 中 的 
数据 已 经 从 TB(TeraByte) 级 迅速 发 展 到 PB(PetaByte) 级 ,甚至 更 高 的 数量 级 ,对 这 些 超 
大 规模 数据 (大 数据 或 海量 数据 ) 的 分 析 和 处 理 将 给 统计 关系 学 习 研 究 带 来 极 大 的 挑战 。 
目前 已 有 的 统计 关系 学 习 方法 不 能 很 好 地 对 动态 关系 数据 进行 建 模 和 分 析 , 因 此 ,设计 在 
线 学 习 模型 以 实现 对 动态 关系 数据 的 有 效 建 模 是 统计 关系 学 习 的 一 个 研究 热点 。 男 外 ， 
目前 大 部 分 统计 关系 学 习 模 型 都 是 集中 式 的 ,也 就 是 说 ,都 是 基于 单机 实现 的 ,无 论 在 存 
储 , 还 是 在 计算 方面 ,都 不 能 实现 对 海量 数据 的 处 理 。 因 此 ,设计 超大 规模 分 布 式 学 习 算 
法 以 实现 对 海量 关系 数据 的 有 效 建 模 是 另 一 个 值得 深入 探索 的 研究 热点 。 将 统计 关系 学 
习 理 论 和 方法 应 用 到 知识 图 谱 是 最 近 发 展 起 来 的 一 个 新 的 研究 热点 。 








7.5 小 结 


学 习 的 全 部 观点 是 要 让 学 习 Agent 去 接触 数据 。 经 过 一 段 训练 之 后 ,学 到 的 知识 就 
确定 了 (再 经 过 额外 的 训练 , 它 也 会 进行 更 新 )。 要 学 习 的 是 一 个 目标 函数 ,目标 函数 的 表 
示 称 为 假设 。 学 习 过 程 涉及 对 一 个 或 多 个 假设 参数 的 调整 ,这 些 参 数 可 能 包括 树 形 表示 
方式 下 的 子 树 、 高 斯 函数 的 均值 和 标准 差 一 阶 逻 辑 表达 式 中 的 文字 等 。 对 这 些 假设 参数 
进行 调整 可 以 产生 出 假设 的 不 同 变形 ,学 习 过 程 实际 上 就 是 一 个 搜索 过 程 ,用 来 搜寻 能 够 
最 好 表示 目标 函数 的 假设 。 知 识 一 旦 确定 了 ,正确 的 性 能 度量 就 能 够 反映 Agent 在 未 知 
数据 (没有 用 来 训练 的 数据 ) 上 的 执行 效果 。 泛 化 能 力 提 供 了 在 未 知 数据 上 的 一 种 性 能 
度量 。 

在 学 习 发 生 之 前 ,通常 需要 考虑 以 下 问题 。 





需要 学 习 的 是 什么 ? 


目标 西数 的 指定 。 | 对 目标 函数 来 说 ,什么 才 是 最 合适 的 表示 形式 ? 





需要 考虑 到 任务 及 应 用 领域 的 性 质 。 

是 否 存 在 对 目标 函数 形式 的 约束 ? 例如 ,在 某 些 涉及 安全 的 关键 领域 里 , 黑 匣 
学 习 算法 的 选择 ”| 子 算法 或 许 是 不 可 取 的 。 

是 否 存 在 对 学 习 时 间 的 约束 ? 

是 否 需要 并 行 实现 ? 





数据 可 以 存放 在 数据 库 中 。 
数据 的 选择 可 以 通过 扫描 图 像 或 监控 传感器 的 输出 获取 数据 。 
训练 数据 是 否 足 够 ? 
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需要 对 训练 集 、 验 证 集 和 测试 集 进 行 选择 。 每 个 集合 都 应 该 能 代表 目标 函数 需 
要 处 理 的 数据 。 

预 处 理 数 据 在 进入 到 学 习 算法 之 前 需要 某 种 形式 的 预 处 理 , 这 是 典型 的 方法 。 
数据 子 集 的 选择 ”| 维 数 灾难 就 是 要 进行 预 处 理 的 一 个 原因 。 固 有 维 的 个 数 通 常会 少 于 属性 的 个 
数 ,这 样 , 预 处 理 就 用 来 将 数据 转换 成 为 更 简洁 的 表示 形式 (更 低 维 )。 如 二 维 平 
面 上 的 一 条 直线 ,其 固有 维 数 是 1。 预 处 理 的 其 他 形式 包括 特征 抽取 ,如 图 像 中 
的 边缘 检测 


必须 存在 某 种 方法 用 来 对 学 习 进行 评判 。 例 如 , Agent 通常 需要 对 其 性 能 进行 
评估 。 对 性 能 的 评判 可 采取 多 种 方式 进行 计算 。 对 简单 例子 来 说 ,也 许 只 计算 











本 相应 分 类 函数 或 回归 函数 的 精度 即 可 。 而 其 他 一 些 性 能 度量 方式 可 能 还 需要 
一 个 用 来 计算 期 望 奖励 的 效用 函数 
某 些 学 习 算法 执行 的 是 连续 的 在 线 更 新 。 这 样 的 例子 如 贝 叶 斯 网 络 中 先 验 分 
终止 准则 布 的 更 新 。 更 多 算法 则 倾向 于 离线 方式 , 当 满足 了 某 个 准则 时 ,将 会 终止 学 习 。 





例如 ,精度 不 再 提高 了 ,或 者 是 训练 了 足够 长 的 时 间 


随 着 机 器 学 习 研 究 的 不 断 深入 开展 和 计算 机 技术 的 进步 ,人 们 已 经 设计 出 不 少 具有 
优良 性 能 的 机 器 学 习 系统 ,并 已 投入 实际 应 用 。 

这 些 应 用 领域 涉及 图 像 处理 、 模 式 识别 .机 器 人 动力 学 与 控制 .自动 控制 .自然 语言 理 
解 .语音 识 别 、 信 号 处 理 和 专家 系统 等 。 与 此 同时 ,各 种 改进 型 学 习 算 法 得 以 开发 ,显著 地 
改善 了 机 器 学 习 网 络 和 系统 的 性 能 。 

如 今 ,计算 机 视觉 领域 呈现 出 很 多 新 的 发 展 趋势 ,其 中 最 显著 的 是 应 用 的 爆炸 性 增 
长 。 除 了 手机 、 个 人 计算 机 和 工业 检测 外 ,在 智能 安防 机器人、 自动 驾驶 、 智 慧 医疗 ,无 人 
机 、 增 强 现实 (AR) 等 领域 都 出 现 了 各 种 形态 的 计算 机 视觉 应 用 。 

今后 机 器 学 习 将 在 理论 概念 、. 计 算 机 理 、 综 合 技术 和 推广 应 用 等 方面 开展 新 的 研究 。 
其 中 ,对 结构 模型 .计算 理论 .算法 和 混合 学 习 的 开发 尤为 重要 。 

周志 华 在 “机 器 学 习 : 发 展 与 未 来 ”中 提出 “学 件 ”(learnware) 的 概念 [144】。 学 件 
由 两 部 分 组 成 : 预 训练 的 模型 和 描述 模型 的 “规约 ”(specification)。 学 件 中 的 预 训练 模 
型 需要 满足 3 个 性 质 : 可 重用 (reusable) 、 可 演进 (evolvable) ,可 了 解 (comprehensible) 。 
可 重用 是 指 学 件 的 预 训练 模型 仅 利用 少量 数据 进行 更 新 或 增强 即 可 用 于 新 任务 。 可 
演进 是 指 学 件 的 预 训练 模型 应 能 感知 环境 变化 ,并 针对 变化 主动 自 适应 调整 。 因 为 不 
太 可 能 有 绝对 精确 的 规约 和 需求 说 明 , 所 以 模型 要 能 主动 感知 到 新 任务 与 规约 描述 的 
差异 ,并 适应 新 任务 环境 中 可 能 存在 的 变化 。 可 了 解 是 指 学 件 的 模型 应 能 在 一 定 程度 
上 被 了 解 , 包 括 其 目标 、 学 习 结 果 、 资 源 要 求 、 典 型 任务 性 能 等 ,否则 将 难以 给 出 模型 的 
功能 规约 , 且 通 过 重用 、 演 进 后 获得 模型 的 有 效 性 和 正确 性 也 难以 保障 。 学 件 中 的 “ 规 
约 ” 则 需 能 给 出 模型 的 合适 刻画 ,在 一 定 程度 上 说 明 这 个 模型 的 能 力 和 适用 范围 等 。 
规约 也 许可 以 基于 逻辑 、 统 计量 ,甚至 精简 数据 .。“ 学 件 ” 的 优势 体现 在 : 可 重用 使 得 仅 
需 少 量 数据 更 新 既 有 模型 ,不 再 需要 巨 量 训练 数据 ;可 演进 使 得 学 件 能 适应 环境 的 变 
化 ;可 了 解 使 得 模型 能 力 能 被 探查 ;模型 可 以 从 专家 级 模型 基础 上 重用 演进 而 来 ,使 得 
用 户 较 易 获 得 专家 级 结果 ;分 享 出 去 的 是 模型 ,而 不 是 数据 ,回避 了 数据 隐私 和 所 有 权 
的 问题 。 
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习题 


什么 是 学 习 和 机 器 学 习 ? 为 什么 要 研究 机 器 学 习 ? 

简 述 机 器 学 习 系 统 的 基本 结构 ,并 说 明 各 部 分 的 作用 。 

试 解释 决策 树 学 习 算 法 。 举 例 计 算 表 7-3 中 信息 炉 和 信息 增益 。 

试 说 明 归纳 学 习 的 模式 和 学 习 方法 。 

什么 是 基于 范例 的 学 习 ? 解释 其 推理 和 学 习 过 程 。 

简 述 解释 学 习 的 基本 原理 .学 习 形式 和 功能 。 

假设 想 教 炎 星人 关于 革 果 的 知识 ,再 假定 火星 人 的 感觉 系统 仅 用 如 下 信息 建立 在 语 
义 网 络 中 : 

(1) 物体 的 颜色 是 红 、 绿 、 蓝 、 紫 、 白 或 黑 。 

(2) 物体 的 重量 是 一 个 数 。 

(3) 物体 的 形状 是 图 7-65 中 所 示 树 中 那些 形状 中 的 任 一 种 。 

(4) 物体 的 特性 是 不 可 吃 的 、 脆 的 或 有 气味 的 。 该 物体 没有 其 他 特性 。 






图 形 对 象 





图 7-65 形状 的 分 类 树 


选择 如 下 教学 次 序 。 每 一 个 例子 都 应 用 了 什么 启发 式 试探 法 ,并 解释 从 中 学 到 了 
御 交 。 


























例子 结果 颜色 形状 重量 特性 

1 正 红 球形 4 脆 

2 正 红 球形 4 

3 反 红 球形 4 不 可 吃 
4 正 绿 球形 1 

5 正 绿 球形 7 

6 正 红 蛋 形 5 

7 反 红 正方 体形 4 




















7.8 假设 要 开 一 把 需要 有 4 个 齿 的 老式 钥匙 开 的 锁 , 每 一 个 齿 从 钥匙 的 枝 干 突 出 0,1， 
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2,3 或 4mm。 图 7-66 为 这 种 钥匙 的 一 个 示例 。 





图 7-66 一 把 有 4 个 齿 的 钥匙 


再 假设 你 弯 卷 了 一 个 精巧 的 配 锁 工 具 , 能 以 某 种 方式 把 得 到 的 试验 钥匙 分 成 如 下 两 组 。 
@ 第 1 组 钥匙 太 松 , 没 有 哪 一 个 齿 过 于 突出 , 且 至 少 有 一 个 齿 不 够 突出 。 

@ 第 2 组 钥匙 太 紧 ,至 少 有 一 个 齿 过 于 突出 ,而 其 他 齿 可 能 不 够 突出 。 

有 了 配 锁 工 具 , 把 所 有 得 到 的 钥匙 分 类 ,如 图 7-67 所 示 。 


第 1 组 第 2 组 
太 松 太 紧 














图 7-67 一 些 太 松 的 钥匙 和 一 些 太 紧 的 钥匙 


(1) 用 仅 从 第 1 组 太 松 的 钥匙 的 试验 结果 确定 一 枚 内 封 钥 匙 ,使 得 : 
Q@ 正确 钥匙 上 的 每 一 个 齿 或 者 与 内 封 形 上 相应 的 齿 一 样 长 ,或 者 比 它 更 长 。 
@ 在 内 封 形 上 的 每 一 个 齿 与 第 1 组 试验 结果 证 明 的 一 样 长 。 
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(2) 用 你 所 需要 的 任何 试验 结果 确定 一 个 外 封 钥匙 ,使 得 ; 
a 正确 钥匙 上 的 每 一 个 齿 与 外 封 形 上 相应 的 齿 一 样 长 或 者 比 它 更 短 。 
@ 在 外 封 形 上 的 每 一 个 齿 与 第 1 组 和 第 2 组 的 试验 结果 证 明 的 一 样 短 。 
7.9 ”在 前 面 习题 的 背景 中 , 试 识别 下 列 哪些 能 被 看 作为 似是而非 例 。 
(1) 具有 小 面积 的 钥匙 。 
(2) 具有 大 面积 的 钥匙 。 
(3) 完全 在 内 封 中 的 钥匙 。 
(4) 完全 在 外 封 中 的 钥匙 。 
(5) 至 少 有 一 个 齿 在 内 封 中 的 钥匙 。 
(6) 正好 有 一 个 齿 在 内 封 外 的 钥匙 。 
(7) 太 紧 的 钥匙 , 它 正 好 仅 在 一 个 齿 上 与 一 个 太 松 的 钥匙 有 差别 。 
(8) 一 个 对 于 内 封 的 方差 之 和 是 最 小 的 钥匙 。 
(9) 一 个 对 于 外 封 的 绝对 齿 差 之 和 是 最 小 的 钥匙 。 
7.10” 试 比较 说 明 符号 系统 和 连接 机 制 在 机 器 学 习 中 的 主要 思想 。 
7.11 考虑 如 图 7-68 所 示 的 单 神经 元 感知 机 网 络 。 该 网 络 的 判定 边界 为 Wp 十 6 二 0。 
试 证 明 : 车 5 二 0, 那 么 判定 边界 是 一 个 向 量 空 间 。 
输入 对 称 硬 极限 层 











a=hardlims(Wp+b) 


图 7-68 单 神经 元 感知 机 


7.12 单 层 感知 机 只 适用 于 一 组 线性 可 分 的 模式 。 如 果 两 个 模式 是 线性 可 分 的 , 则 它们 
- 定 是 线性 无 关 的 吗 ? 
7.13 考虑 图 7-69 所 示 的 原型 模式 。 
(1) 这 些 模式 是 否 正 交 ? 
(2) 使 用 Hebb 规则 ,为 这 些 模 式 设计 一 个 自 联 








想 存储 器 。 
(3) 输入 图 7-69 中 的 原型 模式 p,, 求 网 络 a a n 
响应 。 图 7-69 原型 模式 


7.14 求 下 列 函 数 的 极 小 点 : 
F(x) 一 5zi — 6x1zxz 5x dr 十 4zz 
(1) 画 出 该 函数 的 轮廓 线 图 。 
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(2) 假设 学 习 速 度 很 小 ,起 始点 为 zo 二 [一 1 一 2.5] , 画 出 (1) 中 轮廓 线 的 最 速 下 
降 法 的 轨迹 。 
(3) 最 大 的 稳定 学 习 速度 是 多 少 ? 
7.15 假定 要 设计 一 个 ADALINE 网 络 区 分 输入 向 量 的 不 同类 别 。 首 先 使 用 如 下 类 别 : 
类 别 工 : pi=[1 1] 且 轧 王 [一 1 一 1]? 
类 别 卫 : ps 二 [2 2 本 
(1) 能 否 设 计 一 个 ADALINE 网 络 做 这 种 区 分 ? 如 可 行 ,请 给 出 权 值 和 偏 置 。 
再 考虑 下 面 的 不 同类 别 : 
类 别 目 : pi==[1 1J? 且 p:=[1 一 1 
类 别 W : ps 二 [1 0J" 
(2) 能 否 设计 一 个 ADALINE 网 络 做 这 样 一 个 区 分 ? 如 可 行 , 请 给 出 权 值 和 偏 置 。 
7.16 一 个 飞机 中 的 飞行 员 通过 飞机 座舱 中 的 麦克 风 讲 话 。 由 于 飞行 员 的 话音 信号 被 飞 
机 发 动机 噪声 所 干扰 ,控制 塔 内 的 空中 交通 控制 员 不 能 接收 到 正确 的 话音 。 请 设 
计 一 个 自 适应 ADALINE 滤波 器 ,以 减少 控制 塔 内 收 到 信号 的 噪声 。 
7.17 设计 一 个 能 将 图 7-70 中 的 6 个 模式 分 类 的 识别 系统 。 
























































模式 
量 G F 
目标 60 0 -60 


图 7-70 模式 及 其 分 类 目标 


这 些 模式 表示 字母 T.G 和 下 ,上 面 一 排 是 它们 的 原始 形式 ,下 面 一 排 是 将 它们 移 
动 后 的 形式 。 这 些 字母 的 分 类 目标 分 别 为 60,0 和 一 60, (使 用 60.0 和 一 60 的 原 
因 是 为 了 较 好 地 在 它们 使 用 的 仪器 表面 显示 它们 的 网 络 输出 结果 。) 目标 是 训练 网 
络 ,使 得 它 将 6 个 模式 划分 到 相应 的 T.G 和 下 组 中 。 
7.18 基于 反 向 传播 的 概念 , 求 一 个 能 更 新 图 7-71 所 示 的 递归 网 络 的 权 值 w 和 w 的 
算法 。 
输入 线性 递归 层 


n(k) A a(k+1) D al 月 
a(0) 


a(k+1)=purelin(wip(h}+w2a(A)) 
图 7-71 线性 递归 网 络 
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24 
25 


26 


27 
28 


29 


一 个 S 型 函数 的 例子 定义 为 


1 
1 十 exp (—av) 


它 的 极 值 为 0 和 1。 证 明 它 关于 vw 的 导数 为 


dp 一 
3 agp (WL1 gv)] 


此 外 ,这 个 导数 在 原点 的 值 是 多 少 ? 
一 个 奇 的 S 型 函数 定义 为 


9(v) = 


1 — exp(— av) 
1 十 exp( 一 ao) 


一 tanh (到 ] 


其 中 ,tanh 指 双 曲 正切 。 它 的 极 值 为 一 1 和 十 1。 证 明 它 关 于 vw 的 导数 如 下 。 


= [1 一 p(w)] 


9(v)= 





dv 
这 个 导数 在 原点 的 值 是 多 少 ? 假设 倾斜 参数 a 无 穷 大 ,gp(v) 的 结果 是 什么 形式 ? 
另外 一 个 奇 的 S 型 函数 是 代数 S 型 。 
9(v) = 2 
VIF 

它 的 极限 值 为 一 1 和 十 1。 证 明 它 关于 v 的 导数 如 下 。 

dp _ g(a) 

dv 人 


这 个 导数 在 原点 的 值 是 多 少 ? 

神经 元 7 从 其 他 4 个 神经 元 接受 输入 ,它们 的 活动 水 平 为 10, 一 20,4 和 一 2。 神 经 
元 j 的 每 个 突 触 权 值 为 0.8,0.2, 一 1.0 和 一 0.9. 计算 下 列 两 种 情况 下 神经 元 j 的 
输出 。 

(a) 神经 元 是 线性 的 。 

(b) 神经 元 表示 为 McCulloch-Pitts 模型 。 

这 里 假设 神经 元 的 阅 值 为 0。 

一 个 全 连接 的 前 向 网 络 具 有 10 个 源 结 点 ,2 个 隐 层 (一 个 隐 层 有 4 个 神经 元 , 男 一 
个 隐 层 有 3 个 神经 元 ) ,1 个 输出 神经 元 。 构 造 这 个 网 络 的 结构 图 。 

构造 一 个 全 连接 的 具有 5 个 神经 元 但 没有 自 反馈 的 递归 网 络 。 

一 个 递归 网 络 具 有 3 个 源 结 点 、2 个 隐 层 神经 元 和 4 个 输出 神经 元 。 构 造 这 个 网 
络 的 结构 图 。 

用 C 语言 编写 一 套 计 算 机 程序 ,用 于 执行 BP 学 习 算 法 。 

试 应 用 神经 网 络 模型 优化 求解 推销 员 旅行 问题 。 

考虑 一 个 具有 阶梯 形 值 阐 函数 的 神经 网 络 ,假设 : 

(1) 用 一 常数 乘 所 有 的 权 值 和 阅 值 ; (2) 用 一 常数 加 所 有 权 值 和 阅 值 。 

试 说 明 网 络 性 能 是 否 会 有 变化 ? 

增 大 权 值 是 否 能 使 BP 学 习 变 慢 ? 
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7.30 考虑 包括 单个 权重 的 网 络 的 简单 例子 , 它 的 代价 函数 是 : 
go) = ki (wo— wo)’ 十 Rs 
其 中 ,wo 、k! 和 ks 是 常数 。 用 具有 动量 项 的 反 向 传播 算法 最 小 化 Ew) 。 
探索 包含 的 动量 项 常数 a 怎样 影响 学 习 过 程 。 特 别 注意 使 用 a 收敛 所 需 的 步 数 。 
7.31 研究 使 用 S 型 非 线 性 函数 的 反 向 传播 学 习 方 法 获得 一 对 一 映射 ,描述 如 下 。 


(1) f(z)=1/z, 1<zx<100 
(2) F(z) 一 logioz， 1 委 xz 科 10 
(3) f(x)=exp(—zx) 1<z<10 
(4) f(x)=sin x, 1<z< 了 3 
对 每 个 映射 ,进行 如 下 过 程 。 


(a) 建立 两 个 数据 集 : 一 个 用 于 网 络 训练 ; 另 一 个 用 于 测试 。 

(b) 假设 具有 单个 隐 含 层 ,利用 训练 数据 集 计算 网 络 的 突 触 权重 。 

(c) 通过 使 用 测试 数据 给 网 络 的 计算 精度 赋值 。 

使 用 单个 隐 含 层 , 但 隐 含 神经 元 数目 可 变 ,分 析 网 络 性 能 是 如 何 受 隐 含 层 神经 元 数 
目 变化 影响 的 。 

7.32 表 7-6 的 数据 表示 了 澳大利亚 野兔 眼睛 品 状 体 的 重量 为 年 龄 的 函数 。 没 有 简单 的 
解析 函数 可 以 精确 解释 这 些 数 据 , 因 为 我 们 不 能 得 到 一 个 单 值 函 数 。 相 反 ,利用 一 
个 负 指数 我 们 有 这 个 数据 集 的 一 个 非 线性 最 小 平方 模型 ,具体 如 下 表示 。 

y= 233.846(1 一 exp( 一 0.006042z)) 十 e 
其 中 , e 是 误差 项 。 
利用 反 向 传播 算法 设计 一 个 多 层 感 知 器 , 它 能 够 为 这 个 数据 集 提 供 一 个 非 线性 最 
小 平方 逼近 。 试 与 前 述 的 最 小 平方 模型 比较 你 的 结果 。 


表 7-6 澳大利亚 野兔 眼睛 晶状体 重量 






































年 龄 /天 | 重量 /mg | 年 龄 /天 | 重量 /mg | 年 龄 /天 | 重量 /mg | 年 龄 /天 | 重量 /mg 
15 21.66 75 94.6 218 174. 18 338 203. 23 
15 22.75 82 92.5 218 173.03 347 187. 38 
15 22.3 85 105 219 173.54 354 189.7 
18 31. 25 91 101.7 224 177. 86 357 195. 31 
28 44. 79 91 102.9 225 177. 68 375 202. 63 
29 40.55 97 110 227 173.73 394 224. 82 
37 50.25 98 104.3 232 159. 98 513 203.3 
37 46. 88 125 134.9 232 161.29 535 209.7 
44 52.03 142 130. 68 237 187.07 554 233.9 
50 63.47 142 140. 58 246 176. 13 591 234.7 
50 61. 13 147 155.3 258 183.4 648 244.3 
60 81 147 152.2 276 186. 26 660 231 
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续 表 
年 龄 /天 | 重量 /mg | 年 龄 /天 | 重量 /mg | 年 龄 /天 | 重量 /mg | 年 龄 /天 | 重量 /mg 

61 73.09 150 144.5 285 189. 66 705 242. 4 
64 79.09 159 142. 15 300 186. 09 723 230.77 
65 79.51 165 139. 81 301 186.7 756 242. 57 
65 65. 31 183 15522 305 186.8 768 232. 12 
72 71.9 192 145. 72 312 195.1 860 246.7 
75 86.1 195 161.1 317 216. 41 
































7.33 图 7-72 给 出 了 几 复归 一 化 的 向 量 。 根 据 图 7-73 所 示 的 竞争 网 络 模型 设计 其 网 络 
权 值 ,使 得 该 网 络 能 以 最 少 的 神经 元 区 分 图 7-72 中 的 向 量 。 同 时 , 画 出 所 采用 的 
权 值 以 及 不 同类 区 域 之 间 的 决策 边界 。 





图 7-72 题 7.33 的 输入 向 量 艇 





图 7-73 题 7.33 的 竞争 网 络 


a=compel( Wp) 


由 于 存在 4 个 类 ,所 以 竞争 层 需要 4 个 神经 元 。 每 个 神经 元 的 权 值 为 该 神经 元 代 
表 的 类 的 标准 向 量 ,因此 ,我 们 将 会 为 每 个 神经 元 选择 距离 大 致 处 于 得 中 心 的 一 个 


标准 向 量 。 


7.34 设计 一 个 LVQ 网 络 ,求解 图 7-74 所 示 的 分 类 问题 。 根 据 图 7-74 中 向 量 的 不 同 显 
示 效 果 , 将 其 分 为 3 类 ,并 画 出 每 个 类 的 区 域 。 





图 7-74 分 类 问题 


多 7 竟 如 器 学 一 本 参 一 一 一 
7.35 (思考 题 ) 字 符 分 类 。 任 务 是 对 数字 0 一 9 分 类 ,有 10 类 且 每 个 目标 向 量 应 该 是 这 
10 个 向 量 中 的 一 个 。0 用 二 0,0,0,0,0,0,0,0,0 二 表示 ,1 用 二 1,0,0,0,0,0,0,0， 
0 二 表示 ,第 1 分 量 为 1, 其 余 为 0。2 一 9 表示 类 推 。 要 学 习 的 数字 显示 在 图 7-75 
中 ,每 个 数字 由 9X7 的 网 格 表示 ,灰色 像素 代表 0, 黑 色 像素 代表 1。 





图 7-75 训练 数据 


提示 : 选择 一 个 63-6-9 的 网 络 结构 ,(9X7) 个 输入 结 点 ,每 个 像素 对 应 一 个 结 点 .6 
个 隐 层 结 点 .9 个 输出 结 点 ,像素 到 输入 层 的 映射 显示 在 图 7-76 中 。 将 网 格 处 理 
为 0 或 1 的 长 位 串 , 并 映射 到 输入 层 , 位 映射 由 左上 角 开 始 向 下 ,直到 网 格 的 整个 
一 列 ,然后 重复 其 他 列 。 





Oooooo 


图 7-76 像素 到 输入 层 的 映射 图 7-77 带 有 噪声 的 测试 数据 


网 络 使 用 的 学 习 率 为 0. 3 ,动量 项 为 0.7, 训 练 600 个 周期 。 若 输出 结 点 的 值 
大 于 0.9, 则 为 ON; 若 输出 结 点 的 值 小 于 0. 1. 则 为 OFF。 当 网 络 训 练 成 功 后 ,对 
7-77 中 的 数据 进行 测试 。 每 个 数字 都 有 一 个 或 多 个 丢失 的 位 。 
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7.36 


(思考 题 ) 用 神经 网 络 对 大 写字 母 分 类 。 任 务 是 对 大 写字 母 A 一 Z 分 类 ,根据 阔 值 ， 
将 26 个 字母 分 为 不 多 于 26 类 。 要 学 习 的 字母 由 7X5 的 网 格 表示 ,灰色 像素 代表 
0, 黑 色 像 素 代 表 1。 采 用 自 适应 谐振 理论 (adaptive resonance theory) 或 其 他 学 习 





算法 。 自 适应 谐振 理论 程序 运行 界面 示例 如 图 7-78 所 示 。 





7. 37 


警戒 线 值 :0.9300 划分 旨 别 : 
学 习 结果 : 共 划分 为 26 羡 





> 
> 


A 
8 
C 
D 
E 
F 
G 
H 
1 
4 
K 
L 
M 


> 





识别 结果 : 
此 字符 属于! 类 

















图 7-78 自 适应 谐振 理论 程序 运行 界面 示例 


(思考 题 ) 深 度 学 习 与 媒体 计算 。 互 联网 的 发 展 已 达到 空前 规模 ,新 闻 网 站 、 微 博 、 
微 信 、 社 交 网 络 、 图 像 视频 共享 网 站 等 各 类 网 络 平台 正在 极 大 地 改变 着 人 们 获取 信 
息 的 方式 。 消 费 类 电子 设备 的 普及 使 普通 民众 不 仅 是 信息 的 消费 者 ,也 成 为 网 络 
信息 的 提供 者 。 同 时 ,媒体 数据 的 来 源 渠道 广内 容 多 样 化 .需求 多 元 化 `. 计 算 复杂 
化 等 特点 也 给 媒体 计算 带 来 了 极 大 挑战 。 查 阅 资料 , 曾 述 深度 学 习 在 媒体 计算 方 


面 的 应 用 技术 。 


(思考 题 ) 大 数据 时 代 的 机 器 学 习 。“ 大 数据 ”代表 数据 多 、 不 够 精确 、 数 据 混杂 、 自 
然 产生 。 大 数据 给 机 器 学 习 带 来 的 问题 不 仅 是 因为 数据 量 大 使 计算 产生 困难 ,还 
因为 更 大 的 困难 和 挑战 是 数据 在 不 同 服务 器 上 获取 的 , 这 些 分 布 在 不 同 服务 器 上 
的 数据 之 间 存 在 某 些 联系 , 但 是 基本 上 不 能 满足 同 分 布 的 假设 , 而 我 们 也 不 可 能 
把 所 有 数据 集中 起 来 进行 处 理 和 学 习 。 传 统 的 机 器 学 习 理 论 和 算法 要 求 数据 是 独 





立 同 分 布 的 , 当 这 个 条 件 不 能 满足 时 , 学 习 模型 和 学 习 算 法 就 发 挥 不 了 作 
读 文献 ,探讨 大 数据 时 代 机 器 学 习 的 特点 ,并 曾 述 其 典型 应 用 。 
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第 名 章 
自然 语言 处 理 技术 


自然 语言 理解 不 仅 需 要 有 语言 学 方面 的 知识 ,而 且 还 需要 有 与 所 理解 话 
题 相关 的 背景 知识 ,必须 很 好 地 结合 这 两 方面 知识 ,才能 建立 有 效 的 自然 语 
言 理解 程序 。 对 自然 语言 的 理解 和 处 理 开 始 于 机 器 翻译 。 自 然 语言 处 理 是 
植 根 于 计算 机 科学 .语言 学 与 数学 等 多 学 科 的 一 门 新 兴学 科 , 它 的 研究 内 容 
主要 是 自然 语言 信息 处 理 ,也 就 是 人 类 语言 活动 中 信息 成 分 的 发 现 、 提 取 、 存 
储 、 加 工 与 传输 。 

本 章 首先 从 自然 语言 的 词法 、 句 法 .语义 分 析 的 角度 介绍 了 自然 语言 理 
解 所 涉及 的 主要 方面 ,然后 介绍 了 真实 文本 处 理 和 对 话 分 析 问 题 , 最 后 从 应 
用 角度 阐述 了 信息 检索 、 机 器 翻译 和 语音 识别 技术 。 


8.1 自然 语言 理解 的 一 般 问 题 








8.1.1 自然 语言 理解 的 概念 及 意义 


用 自然 语言 进行 交流 ,不管 是 以 文字 的 形式 ,还 是 以 交谈 的 形式 ,都 非常 
依赖 于 参与 者 的 语言 技能 、 感 兴趣 的 领域 知识 和 领域 内 的 谈话 预期 。 理 解 语 
言 不 仅仅 是 对 文字 的 翻译 ,还 需要 推测 说 话 人 的 目的 、 知 识 和 假设 ,以 及 交谈 
的 上 下 文 语 境 。 实 现 一 个 自然 语言 理解 程序 需要 表示 出 所 涉及 领域 中 的 知 
识 和 期 望 ,并 能 进行 有 效 的 推理 。 还 必须 考虑 一 些 重要 的 问题 ,如 非 单调 、 信 
念 改变 、 比 喻 、 规 划 、` 学 习 和 人 类 交互 的 实际 复杂 性 。 然 而 ,这 些 问 题 正 是 人 


工 智能 本 身 的 核心 问题 。 
例如 ,关于 某 计 算 机 学 院 在 网 上 招聘 的 广告 .下面 给 出 了 一 部 分 内 容 。 
某 大 学 计算 机 系 …… 拟 招 聘 两 名 教授 。 我 们 希望 招聘 对 以 下 领域 
感 兴趣 的 人 员 : 
软件 ,包括 分 析 、 设 计 和 开发 工具 …… 
系统 ,包括 体系 结构 、 编 译 器 、 网 络 …… 


申请 者 必须 具有 以 下 专业 的 博士 学 位 …… 
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我 系 在 高 性 能 计算 、 人 工 智能 等 领域 具有 国际 公认 的 研究 计划 ……。 并 且 与 圣 达 

菲 研究 所 以 及 几 个 国家 实验 室 开展 了 深入 的 研究 合作 …… 

理解 这 条 招聘 广告 时 会 出 现 以 下 几 个 问题 。 

(1) 只 明确 表明 “教授 ”, 读 者 如 何 知道 这 条 广告 是 招聘 大 学 教师 ? 任期 多 长 时 间 ? 

(2) 在 大 学 环境 中 工作 需要 掌握 什么 软件 和 软件 工具 的 知识 ? 是 C、Prolog, 还 是 
UML? 这 些 都 没有 明确 提 到 。 一 个 人 需要 有 许多 关于 大 学 授课 和 研究 的 知识 ,才能 理解 
这 些 要 求 。 

(3) 为 什么 要 在 大 学 招聘 广告 中 提 到 国际 公认 的 研究 计划 和 与 著名 研究 所 的 合作 ? 

(4) 计算 机 如 何 概括 广告 的 主要 意思 ? 计算 机 必须 掌握 什么 知识 ,才能 为 一 个 正在 
找 工作 的 求职 博士 从 万 维 网 上 智能 地 检索 到 本 广告 ? 

自然 语言 理解 中 (至 少 ) 有 3 个 主要 问题 : 第 一 ,需要 具备 大 量 的 人 类 知识 。 语 言 如 
作 描 述 的 是 复杂 世界 中 的 关系 。 关 于 这 些 关系 的 知识 ,必须 是 理解 系统 的 一 部 分 。 第 二 ， 
语言 是 基于 模式 的 : 音素 构成 单词 ,单词 组 成 短语 和 句子 。 音 素 . 单 词 和 句子 的 顺序 不 是 
随机 的 。 没 有 对 这 些 元 素 的 一 种 规范 性 的 使 用 ,就 不 可 能 达成 交流 。 最 后 ,语言 动作 是 主 
体 (agent) 的 产物 ,或 者 是 人 ,或 者 是 计算 机 。 主 体 处 在 个 体 层面 和 社会 层面 的 复杂 环境 
中 。 语 言 动 作 都 是 有 其 目的 性 的 。 

语言 学 是 以 人 类 语言 为 研究 对 象 的 学 科 。 它 的 探索 范围 包括 语言 的 结构 .语言 的 运 
用 ,语言 的 社会 功能 和 历史 发 展 ,以 及 其 他 与 语言 有 关 的 问题 。 

自然 语言 是 相对 于 人 造 语言 (如 C 语言 .Java 语言 ) 而 言 的 。 由 于 自然 语言 的 多 义 
性 、 上 下 文 相关 性 、 模 糊 性 、 非 系统 性 、 环 境 相 关 性 、 理 解 与 所 应 用 的 目标 相关 (如 目标 是 回 
答 问题 .执行 命令 ,还 是 机 器 翻译 ) ,因此 ,关于 自然 语言 理解 至 今 尚 无 一 致 的 、 各 方 可 以 接 
受 的 定义 。 从 微观 上 讲 ,自然 语 言 理解 是 指 从 自然 语言 到 机 器 内 部 的 一 个 映射 ;宏观 上 
看 ,自然 语言 是 指 机 器 能 够 执行 人 类 所 期 望 的 某 些 语 言 功能 。 这 些 功 能 主要 包括 如 下 几 
方面 。 

(1) 回答 问题 : 计算 机 能 正确 地 回答 用 自然 语言 输入 的 有 关 问 题 。 

(2) 文摘 生成 : 机 器 能 产生 输入 文本 的 摘要 。 

(3) 释义 : 机 器 能 用 不 同 的 词语 和 句 型 复述 输入 的 自然 语言 信息 。 

(4) 翻译 : 机 器 能 把 一 种 语言 翻译 成 另外 一 种 语言 。 

自然 语言 有 口语 和 书面 语 两 种 基本 表现 形式 。 书 面 语 比 口语 结构 性 要 强 ,而 且 噪 声 
也 比较 小 。 口 语 信息 包括 很 多 语义 上 不 完整 的 子 句 ,如 果 听 众 关 于 演讲 主题 的 主观 知识 
不 是 很 了 解 ,听众 有 时 可 能 无 法 理解 这 些 口 语 信息 。 书 面 语 理解 包括 词法 .文法 和 语义 分 
析 ,而 口语 理解 还 需要 加 上 语音 分 析 。 

如 果 计 算 机 能 够 理解 处理 自然 语言 ,那么 人 -机 之 间 的 信息 交流 就 能 够 以 人 们 熟悉 
的 本 族 语言 进行 ,这 将 是 计算 机 技术 的 一 项 重大 突破 。 另 一 方面 ,由 于 创造 和 使 用 自然 语 
言 是 人 类 高 度 智 能 的 表现 ,因此 对 自然 语言 处 理 的 研究 也 有 助 于 揭 开 人 类 高 度 智 能 的 奥 
秘 , 深 化 对 语言 能 力 和 思维 本 质 的 认识 。 自 然 语 言 理解 这 个 研究 方向 在 应 用 和 理论 两 个 
方面 都 具有 重大 的 意义 。 
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8.1.2 自然 语言 理解 研究 的 发 展 


自然 语言 理解 的 研究 可 以 分 为 3 个 时 期 : 20 世纪 40 年 代 和 50 年 代 的 萌芽 时 期 .20 
世纪 60 年 代 和 70 年 代 的 发 展 时 期 和 20 世纪 80 年 代 以 后 的 大 规模 真实 文本 处 理 时 期 。 

1. 萌芽 时 期 

自然 语言 理解 的 研究 可 以 追溯 到 20 世纪 40 年 代 末 和 50 年 代 初期 。1946 年 ,第 一 
台 计 算 机 问世 。 几 乎 同时 ,英国 的 A. Donald Booth 和 美国 的 W. Weaver 就 开始 了 机 器 
翻译 方面 的 研究 ,这 是 由 于 当时 国际 上 正 处 于 美 苏 对 抗 时 期 , 美 . 苏 等 国 开展 的 俄 -英和 
英 - 俄 互 译 研究 工作 开启 了 自然 语言 理解 研究 的 早期 阶段 。 

实际 上 ,机 器 翻译 是 很 复杂 的 ,由 于 单纯 地 利用 规范 的 文法 规则 ,而 低估 了 它 的 困难 
程度 ,再 加 上 当时 计算 机 处 理 能 力 低 下 ,因此 机 器 翻译 工作 没有 取得 实质 进展 。 

在 这 一 时 期 ,M. Chomsky 提出 了 形式 语言 和 形式 文法 的 概念 ,他 把 自然 语言 和 程序 
设计 语言 置 于 相同 的 层面 ,用 统一 的 数学 方法 解释 和 定义 。M. Chomsky 建立 的 转换 生 
成 文法 TG 使 得 语言 学 的 研究 进入 了 定量 的 研究 阶段 ,也 促进 了 程序 设计 语言 学 的 极 大 
发 展 ,出 现 了 诸如 BASIC、FORTRAN 及 ADA 等 语言 。 对 于 Chomsky 转换 生成 文法 ， 
虽然 它 描述 的 是 基于 语句 生成 的 十 分 严格 的 过 程 ,但 是 对 于 人 类 自然 形成 的 极其 复杂 的 
语言 现象 而 言 , Chomsky 的 理论 还 不 具备 足够 的 能 力 处 理 自然 语言 问题 。 不 过 ， 
Chomsky 建立 的 文法 体系 仍然 是 目前 自然 语言 理解 中 文法 分 析 所 必须 依赖 的 文法 体系 。 

2. 发 展 时 期 

从 20 世纪 60 年 代 开 始 ,在 人 机 对 话 方面 的 研究 取得 了 一 定 成 功 。 这 些 人 机 对 话 系 
统 可 以 作为 专家 系统 、 办 公 自 动 化 及 信息 检索 等 系统 的 自然 语言 人 机 接口 ,具有 很 大 的 实 
用 价值 。 这 期 间 , 自 然 语言 理解 系统 的 发 展 实际 上 可 以 分 为 两 个 阶段 : 20 世纪 60 年 代 以 
关键 词 匹配 技术 为 主 的 阶段 和 20 世纪 70 年 代 以 句法 -语义 分 析 为 主流 技术 的 阶段 。 

20 世纪 60 年 代 开发 的 自然 语言 理解 系统 大 都 没有 真正 意义 上 的 文法 分 析 , 而 主要 
依靠 关键 词 匹配 技术 识别 输入 句子 的 意义 ,在 这 些 系 统 中 ,事先 存放 了 大 量 包含 某 些 关键 
词 的 模式 ,每 个 模式 都 与 一 个 或 多 个 解释 (又 叫 响 应 式 ) 相 对 应 。 系 统 将 当前 输入 的 句子 
同 这 些 模式 逐个 匹配 ,一 旦 匹配 成 功 , 便 立 即 得 到 这 个 句子 的 解释 ,而 不 再 考虑 句子 中 那 
些 不 属于 关键 词 的 成 分 对 句子 意义 会 有 什么 影响 。 匹 配 成 功 与 否 只 取决 于 语句 模式 中 包 
含 的 关键 词 及 其 排列 次 序 , 非 关 键 词 不 能 影响 系统 的 理解 。 

这 一 时 期 的 几 个 著名 系统 包括 1968 年 出 现 的 SRI 和 ELIZA 系统 等 。B. Raphael 
在 美国 麻 省 理工 学 院 完成 的 语义 信息 检索 (Semantic Information Retrieval,SIR) 系 统 ,能 
记 住 用 户 通过 英语 告诉 它 的 事实 ,然后 对 这 些 事实 进行 演绎 ,回答 用 户 提出 的 问题 。 
J. Weizenbaum 在 美国 麻 省 理工 学 院 设 计 的 ELIZA 系统 ,能 模拟 一 位 心理 治疗 医生 (机 
器 ) 同 一 位 患者 (用 户 ) 的 谈话 。 

进入 20 世纪 70 年 代 后 ,自然 语言 理解 的 研究 在 句法 -语义 分 析 技 术 方 面 取 得 了 重要 
进展 ,出 现 了 若干 有 影响 的 自然 语言 理解 系统 ,在 语言 分 析 的 深度 和 难度 方面 比 早 期 的 系 
统 有 了 长 足 的 发 展 。 这 个 时 期 的 代表 系统 包括 W. Woods 设计 的 LUNAR, 它 是 第 一 个 
允许 用 普通 英语 同 数 据 库 对 话 的 人 机 接口 ,用 于 协助 地 质 学 家 查找 、 比 较 和 评价 阿波 罗 
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11 飞船 带 回 的 月 球 标本 的 化 学 分 析 数 据 ;T. Winograd 设计 的 SHEDLU 系统 是 一 个 在 
“积木 世界 ?中 进行 英语 对 话 的 自然 语言 理解 系统 , 它 把 名 法、 推理 `、 上 下 文 和 背景 知识 灵 
活 地 结合 于 一 体 ,模拟 一 个 能 够 操纵 桌子 上 一 些 积木 玩具 的 机 器 人 手臂 ,用 户 通过 人 一 机 
对 话 方式 命令 机 器 人 放置 那些 积木 块 , 系 统 通 过 屏幕 给 出 回答 并 显示 现场 的 相应 情景 。 

3. 大 规模 真实 文本 处 理 时 期 

20 世纪 80 年 代 后 ,自然 语言 理解 的 应 用 研究 广泛 开展 ,实用 化 和 工程 化 的 努力 使 得 
一 批 商品 化 的 自然 语言 人 机 接口 和 机 器 翻译 系统 出 现 于 国际 市 场 。 著 名 的 人 机 接口 系统 
有 美国 人 工 智能 公司 (AIC) 生 产 的 英语 人 一 机 接口 系统 Intellect, 美 国 弗 雷公 司 生产 的 
Themis 人 一 机 接口 。 在 自然 语言 理解 的 基础 上 ,机 器 翻译 工作 也 开始 走出 低谷 ,重新 兴 
起 ,并 逐步 走向 实用 。 有 较 高 水 平 的 翻译 系统 ,包括 欧洲 共同 体 在 美国 乔治 敦 大 学 开发 的 
机 译 系 统 SYSTRAN 的 基础 上 ,成 功 地 实现 了 英 、 法 、 德 . 西 . 意 及 葡 等 多 语 对 的 机 器 翻译 
系统 ,以 及 美国 的 META 等 系统 。 

在 此 期 间 , 自 然 语言 理解 研究 引入 知识 表示 与 处 理 方法 ,以 及 领域 知识 与 推理 机 制 ， 
使 自然 语言 处 理 系统 不 再 局 限于 单纯 的 语言 句法 和 词法 的 研究 ,而 与 它 所 表示 的 客观 世 
界 紧 密 结合 ,因此 极 大 地 提高 了 系统 处 理 的 正确 性 。 但是, 仅 依靠 人 工 智 能 技术 ,要 想 把 
处 理 自 然 语 言 所 需 的 知识 都 用 现 有 的 知识 表示 技术 明确 表达 出 来 ,是 不 可 能 的 。 

为 了 处 理 大 规模 的 真实 文本 ,研究 人 员 新 提出 了 语料库 语言 学 (Corpus Linguistics) 。 
它 顺应 了 大 规模 真实 文本 处 理 的 需求 ,以 计算 机 语料库 为 基础 进行 语言 学 研究 及 自然 语 
言 理解 的 研究 。 它 认为 语言 学 知识 的 真正 源泉 是 大 规模 的 来 自 于 生活 的 资料 ;计算 语言 
学 工作 者 的 任务 是 使 计算 机 能 够 自动 或 半自动 地 从 大 规模 语料库 中 获取 处 理 自然 语言 所 
需 的 各 种 知识 ,他们 必须 客观 地 ,而 不 是 主观 地 对 库 中 的 语言 事实 做 出 描述 。 

20 世纪 80 年 代 , 英 国 Leicester 大 学 Leech 领导 的 UCREL 研究 小 组 利用 已 带 有 词 
类 标记 的 语料库 ,经 过 统计 分 析 得 出 了 一 个 反映 任意 两 个 相 邻 标记 出 现 频率 的 “概率 转移 
和 矩阵”。 他 们 设计 的 CLAWS 系统 依据 这 种 统计 信息 (而 不 是 系统 内 存储 的 知识 ), 对 
LOB 语料库 的 一 百 万 词 的 语 料 进行 词类 的 自动 标注 ,准确 率 达 96%。CLAWS 系统 的 成 
功 使 许多 研究 人 员 相 信 ,基于 语料库 的 处 理 思想 能 够 在 工程 上 ,在 宽广 的 语言 覆盖 面 上 解 
决 大 规模 真实 文本 处 理 这 一 艰巨 的 课题 ,至 少 也 是 对 传统 的 处 理 方法 一 个 强 有 力 的 补充 。 

自然 语言 处 理 作 为 语言 信息 处 理 技术 的 主要 基础 学 科 , 其 重要 意义 已 经 得 到 学 术 界 
和 产业 界 越 来 越 多 的 认可 ,在 欧美 已 经 有 不 少 大 学 设立 了 自然 语言 处 理 系 或 专业 ,从 本 科 
起 就 组 织 自然 语言 处 理 的 教学 工作 。 





8.1.3 自然 语言 理解 的 层次 


语言 虽然 表示 成 一 连 串 文 字符 号 或 一 串 声音 流 , 但 其 内 部 事实 上 是 一 个 层次 化 的 结 
构 , 从 语言 的 构成 中 就 可 以 清楚 地 看 到 这 种 层次 性 。 一 个 文字 表达 的 句子 的 层次 是 词素 一 
词 或 词 形 一 词组 或 句子 ,而 声音 表达 的 句子 的 层次 则 是 音素 音节 一 音 词 一 音 句 ,其 中 每 
个 层次 都 受到 文法 规则 的 制约 。 因 此 ,语言 的 处 理 过 程 也 应 当 是 一 个 层次 化 的 过 程 。 

语言 是 一 个 复杂 的 现象 ,包括 各 种 处 理 , 如 声音 或 印刷 字母 的 识别 .语法 解析 、\ 高 层 语 
义 推论 ,甚至 通过 节奏 和 音调 传达 的 情感 内 容 。 为 了 管理 这 个 复杂 性 ,语言 学 家 定义 了 自 
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然 语言 分 析 的 不 同 层次 。 

(1) 韵律 学 (prosody) 处 理 语言 的 节奏 和 语调 。 这 一 层次 的 分 析 很 难 形式 化 ,经 常 被 
省 略 ; 然 而 ,其 重要 性 在 诗歌 和 宗教 圣 歌 的 强大 感染 力 中 是 很 明显 的 ,就 如 同 节 奏 在 儿童 
记 单词 和 婴儿 呀 呀 学 语 中 具有 的 作用 。 

(2) 音韵 学 (phonology) 处 理 的 是 形成 语言 的 声音 。 语 言 学 的 这 一 分 支 对 于 计算 机 
语音 识别 和 生成 很 重要 。 

(3) 词 态 学 (morphology) 涉 及 组 成 单词 的 成 分 (词素 ) ,包括 控制 单词 构成 的 规律 ,如 
前 级 (un-， non-,，anti- 等 ) 的 作用 和 改变 词根 含义 的 后 级 (-ing, -ly 等 )。 词 态 分 析 对 于 确 
定单 词 在 句子 中 的 作用 很 重要 ,包括 时 态 .数量 和 部 分 语音 。 

(4) 语法 (syntax) 研 究 将 单词 组 合成 合法 的 短语 和 句子 的 规律 ,并 运用 这 些 规律 解 
析 和 生成 句子 。 这 是 语言 学 分 析 中 形式 化 最 好 因而 自动 化 最 成 功 的 部 分 。 

(5) 语义 学 (semantics) 考 虑 单词 短语 和 句子 的 意思 以 及 自然 语言 表示 中 传达 意思 
的 方法 。 

(6) 语 用 学 (pragmatics) 研 究 使 用 语言 的 方法 和 对 听众 造成 的 效果 。 例 如 , 语 用 学 能 
够 指出 为 什么 通常 用 “知道 ”回答 “你 知道 几 点 了 吗 ?” 是 不 合适 的 。 

(7) 世界 知识 (world knowledge) 包 括 自然 世界 、 人 类 社会 交互 世界 的 知识 以 及 交流 
中 目标 和 意图 的 作用 。 这 些 通用 的 背景 知识 对 于 理解 文字 或 对 话 的 完整 含义 是 必 不 可 
少 的 。 

虽然 这 些 分 析 层 次 看 上 去 是 自然 而 然 的 ,而 且 符 合 心理 学 的 规律 ,但 是 它们 在 某 种 程 
度 上 是 强加 在 语言 上 的 人 工 划分 。 它 们 之 间 广 泛 的 交互 ,即使 很 低层 的 语调 和 节奏 变化 ， 
也 会 对 说 话 的 意思 产生 影响 ,例如 讽刺 的 使 用 。 这 种 交互 在 语法 和 语义 的 关系 中 体现 得 
非常 明显 ,虽然 沿 着 这 些 界线 进行 某 些 划分 似乎 很 必要 ,但 是 确切 的 分 界线 很 难 定义 。 例 
如 , 像 *They are eating apples” 这 样 的 句子 有 多 种 解析 ,只 有 注意 上 下 文 的 意思 才能 决 
定 。 语 法 也 会 影响 语义 ,如 短语 结构 在 理解 句子 含义 中 所 起 的 作用 。 虽 然 我 们 经 常 讨论 
语法 和 语义 之 间 的 精确 区 别 ,但 是 心理 学 的 证 据 和 它 在 管理 问题 复杂 性 中 的 作用 只 有 有 
保留 地 予以 探讨 。 

虽然 不 同 自然 语言 理解 程序 的 组 织 采 用 不 同 的 原理 和 应 用 一 一 例如 ,数据 库 前 端 、 自 
动 翻译 系统 、 故 事理 解 程序 一 一 但 它们 都 必须 将 原 句子 的 含义 翻译 成 一 种 内 部 表示 。 一 
般 情况 下 ,自然 语言 理解 遵循 图 8-1 所 示 的 过 程 。 

第 一 阶段 是 解析 ,分 析 句 子 的 句法 结构 。 解 析 的 任务 在 于 既 验 证 句子 在 句法 上 的 合 
理 构成 ,又 决定 语言 的 结构 。 通 过 识别 主要 的 语言 关系 ,如 主 - 谓 、 动 - 宾 和 名 词 -修饰 ,解析 
器 可 以 为 语义 解释 提供 一 个 框架 。 我 们 通常 用 解析 树 表示 它 。 解 析 器 运用 的 是 语言 中 语 
法 、 词 态 和 部 分 语义 知识 。 

第 二 阶段 是 语义 解释 , 旨 在 对 文本 的 含义 生成 一 种 表示 ,如 图 8-1 中 的 概念 图 所 示 。 
其 他 的 一 些 通用 的 表示 方法 包括 概念 依赖 ` 框 架 和 基于 逻辑 的 表示 法 等 。 语 义 解释 使 用 
如 名 词 的 格 或 动词 的 及 物性 等 关于 单词 含义 和 语言 结构 的 知识 。 在 图 8-1 中 ,程序 利用 
的 知识 是 : 根据 单词 kiss 的 含义 ,将 默认 值 lips (嘴唇 ) 添 加 到 kissing 的 对 象 中 。 此 外 ， 
语义 一 致 性 检查 也 在 这 一 阶段 完成 。 例 如 ,动词 kiss 的 定义 可 能 包含 这 样 的 约束 : 当主 
体 是 人 时 , 吻 的 对 象 是 人 , 即 正常 情况 下 ,Tarzan 吻 的 是 Jane, 而 不 是 印度 豹 。 
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( 输入: Tarzan kissed Jane. | 
1 语 境 /世界 知识 解释 
解析 
1 人 扩充 表示 : 
解析 本 ka 拥有 宠物 : 印度 鹏 
一 前 语 
人 经 验 者 喜欢 -一 人 Ri > 
名 词 动词 名 词 
| | | 人 : tarzan 人 : jane 
Tarzan kissed Jane 
| 人 主体 吻 对 象 7 
五 
语义 解释 CA > 大 后 
1 
内 部 表示 \ Ct 丛林 位 置 
人 : tarzan 人 : jane 
主体 吻 对 象 至 : 
SE ‘> < RD 问题 回答 程序 、 数 据 库 查 询 
处 理 程序 和 翻译 程序 ， 等 等 
CI 嘴 夺 























图 8-1 生成 句子 内 部 表示 的 各 阶段 


第 三 阶段 要 完成 的 任务 是 将 知识 库 中 的 结构 添加 到 句子 的 内 部 表示 中 ,以 生成 句子 
含义 的 扩充 表示 。 在 这 一 步 中 ,类 似 “Tarzan 喜欢 Jane”Tarzan 和 Jane 生活 在 丛林 中 ” 
“印度 豹 是 Tarzan 的 宠物 ”这 样 的 用 以 充分 理解 语言 所 必需 的 世界 知识 被 添加 了 进来 。 
这 样 产 生 的 结构 表达 了 自然 语言 文字 的 意思 ,可 以 被 系统 用 来 进行 后 续 处 理 。 

举例 来 说 ,在 数据 库 前 端 ,扩充 结构 可 能 结合 了 查询 含义 的 表示 和 数据 库 组 织 的 知 
识 。 这 种 结构 能 够 被 翻译 成 相应 的 数据 库 语言 查询 语句 。 而 在 故事 理解 程序 中 ,这 种 扩 
充 结构 可 能 表示 故事 的 意思 ,并 能 够 用 来 回答 关于 故事 的 问题 。 

绝 大 多 数 ( 非 概率 的 ) 自 然 语言 理解 系统 中 都 存在 这 3 个 阶段 ,尽管 相应 的 软件 模块 
不 一 定 被 明确 划分 出 来 。 例 如 ,许多 程序 不 生成 明确 的 解析 树 ,但 是 直接 生成 内 部 语义 表 
示 。 无 论 怎 样 ,解析 树 都 隐 含 在 对 句子 的 解析 中 。 增 量 解 析 是 一 项 应 用 广泛 的 技术 。 在 
这 种 技术 中 ,句子 中 的 重要 部 分 一 旦 被 解析 生成 ,内 部 表示 的 一 个 片段 将 随 之 生成 。 随 着 
解析 的 进行 ,这 些 片段 合并 成 完整 的 结构 。 我 们 也 可 以 利用 这 些 片段 解决 句子 模糊 性 的 
问题 ,还 可 以 用 来 指导 解析 过 程 。 

有 语言 学 家 将 自然 语言 理解 分 为 5 个 层次 : 语音 分 析 、 词 法 分 析 、 句 法 分 析 、 语 义 分 
析 和 语 用 分 析 。 语 音 分 析 就 是 根据 音 位 规则 ,从 语音 流 中 区 分 出 一 个 个 独立 的 音素 ,再 根 
据 音 位 形态 规则 找 出 一 个 个 音节 及 其 对 应 的 词素 或 词 。 语 用 就 是 研究 语言 所 存在 的 外 界 
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环境 对 语言 使 用 所 产生 的 影响 。 它 描述 语言 的 环境 知识 ,语言 与 语言 使 用 者 在 某 个 给 定 
语言 环境 中 的 关系 。 关 注 语 用 信息 的 自然 语言 处 理 系 统 更 侧重 于 讲话 者 /听话 者 模型 的 
设 定 ,而 不 是 处 理 嵌 入 到 给 定 话 语 中 的 结构 信息 。 研 究 者 们 提出 了 很 多 语言 环境 的 计算 
模型 ,描述 讲话 者 和 他 的 通信 目的 ,听话 者 和 他 对 说 话 者 信息 的 重组 方式 。 构 建 这 些 模型 
的 难点 在 于 如 何 把 自然 语言 处 理 的 不 同方 面 以 及 各 种 不 确定 的 生理 ,心理 ,社会 及 文化 等 
背景 因素 集中 到 一 个 完整 的 .连贯 的 模型 中 。 对 于 词法 分 析 、 句 法 分 析 和 语义 分 析 3 个 层 
次 ,会 在 下 面 讨论 。 

词法 指 词 位 的 构成 和 变化 的 规则 。 和 句法 是 指 组 词 成 句 的 规则 。 语 法 就 是 词 的 构造 、 
变化 的 规则 和 用 词 造句 的 规则 , 它 是 语言 在 其 长 期 发 展 过 程 中 形成 的 ,全 体 成 员 必须 共同 
遵守 的 规则 。 


8.2 词法 分 析 


词法 分 析 是 理解 单词 的 基础 ,其 主要 目的 是 从 句子 中 切 分 出 单词 , 找 出 词汇 的 各 个 词 
素 , 从 中 获得 单词 的 语言 学 信息 并 确定 单词 的 词义 ,如 unchangeable 是 由 un-change-able 
构成 的 ,其 词义 由 这 3 个 部 分 构成 。 不 同 的 语言 对 词法 分 析 有 不 同 的 要 求 ,例如 ,英语 和 
汉语 就 有 较 大 的 差距 。 

在 英语 等 语言 中 ,因为 单词 之 间 是 以 空格 自然 分 开 的 , 切 分 一 个 单词 很 容易 ,所 以 找 
出 句子 的 一 个 个 词汇 就 很 方便 。 但 是 ,由 于 英语 单词 有 词性 、 数 .时 态 、 派 生 及 变形 等 变 
化 ,要 找 出 各 个 词素 就 复杂 得 多 ,需要 对 词尾 或 词 头 进行 分 析 , 如 importable, 它 可 以 是 
im-port-able 或 import-able, 这 是 因为 im ,port able 这 3 个 都 是 词素 。 

通常 ,词法 分 析 可 以 从 词素 中 获得 许多 有 用 的 语言 学 信息 。 如 英语 中 构成 词尾 的 词 
素 “s” 通 常 表示 名 词 复数 或 动词 第 三 人 称 单数 “ly” 通 常 是 副词 的 后 缀 ,而 “ed” 通 常 是 动 
词 的 过 去 分 词 等 ,这 些 信 息 对 于 句法 分 析 也 是 非常 有 用 的 。 另 一 方面 ,一 个 词 可 有 许多 的 
派生 .变形 ,如 work 可 变化 出 works,worked,working,worker,workable 等 。 这 些 派生 
的 、 变 形 的 词 如 果 全 放 入 词典 ,将 是 非常 庞大 的 ,而 它们 的 词根 只 有 一 个 。 自 然 语言 理解 
系统 中 的 电子 词典 一 般 只 放 词 根 ,并 支持 词素 分 析 , 这 样 可 以 大 大 压缩 电子 词典 的 规模 。 

下 面 是 一 个 英语 词法 分 析 的 算法 , 它 可 以 对 按 英语 文法 规则 变化 的 英语 单词 进行 
分 析 。 








repeat 
look for word in dictionary 
if not found 
then modify the word 


until word is found or no further modification possible 


其 中 ,word 是 一 个 变量 ,初始 值 就 是 当前 的 单词 。 
例如 ,对 于 单词 catches \ladies, 可 以 做 如 下 分 析 。 





catches ladies, 词典 中 查 不 到 
catche ladie 修改 1: 去 掉 -s” 


catch ladi 修改 2: 去 掉 “-e” 





400 人 工 者 能 ( 荔 3 瞩 ) 


lady 修改 3: 把 i 变 成 y 

这 样 ,在 修改 2 的 时 候 , 就 可 以 找到 catch ,在 修改 3 的 时 候 就 可 以 找到 lady。 

英语 词法 分 析 的 难度 在 于 词义 判断 ,因为 单词 往往 有 多 种 解释 , 仅 依靠 查 词典 常常 无 
法 判断 。 例 如 ,单词 diamond 有 3 种 解释 : 菱形 , 边 长 均 相等 的 四 边 形 ; 棒 球场 ;钻石 。 要 
判定 单词 的 词义 ,只 能 依靠 句子 中 其 他 相关 单词 和 词组 的 分 析 。 例 如 ,下 面 的 句子 : 

John saw Susan's diamond shining from across the room. 
中 的 diamond 的 词义 必定 是 钻石 ,因为 只 有 钻石 才能 发 光 ,而 萎 形 和 棒球 场 是 不 闪光 的 。 作 
为 对 照 ,汉语 中 的 每 个 字 就 是 一 个 词素 ,所 以 要 找 出 各 个 词素 是 相当 容易 的 ,但 要 切 分 出 各 
个 词 就 非常 困难 ,不 仅 需要 构 词 的 知识 ,还 需要 解决 可 能 遇 到 的 切 分 歧义 ,如 * 不 是 人 才学 人 
才学 ”, 可 以 是 “不 是 人 才 - 学 人 才学 ”, 也 可 以 是 “不 是 人 -才学 人 才学 ”。 再 如 ,三 大 全 国 性 交 
易 市 场 在 渝 布局 ”"(2011 年 3 月 15 日 ,重庆 晨报 文章 )，“ 从 前 门口 有 个 石狮 子 ”。 


案例 : 单词 音节 划分 


通过 查找 含 在 每 个 单词 中 的 元 辅音 序列 ,将 单词 划分 为 音节 。 将 单词 划分 为 音节 的 
算法 主要 是 查找 含 在 每 个 单词 中 的 元 辅音 序列 。 编 程 实现 单词 音节 划分 。 

解 : 这 里 给 出 两 条 常用 的 划分 规则 。 

1) 元 音 (vocal)- 辅 音 (consonant)- 元 音 


对 这 种 情况 ,单词 从 第 一 个 元 音 处 分 开 , 例 如 : 


ruler- ->ru- ler 


Prolog- ->Pro- 1og 
2) 元 音 -辅音 -辅音 -元 音 


对 这 种 情况 ,单词 可 在 两 个 辅音 之 间 分 开 , 例 如 : 


number- — >num- ber 


anger- ->an- ger 


/xxxx 单词 音节 划分 的 Prolog 程序 **xx/ 
DOMAINS 。 /* 单词 拆 开 为 字母 表 * / 
letter= Symbol 
word= letter 关 
PREDICATES 
divide (word,word, word, word) 
vocal (letter) 
consonant (letter) 
string word (string,word) 
append (word, word, word) 
GORT 
/* 本 程序 先 提示 用 户 输入 待 分 音节 单词 ,然后 用 上 述 两 条 规则 将 之 分 解 成 音节 ,并 显示 音节 
划分 结果 。* / 


clearwindow()， 
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write ("Writeaword:"), 
readle(S) ， 
string word(S,Word), 
append (First, Second, Word), 
divide (First, Second, Part1, Part?2), 
string word(Syllablel, Part2), 
string word(Syllable?, Part2), 
write ("Division:",Syllable,"-",Syllable2) ,nl, 
fail. 
CLAUSES 
/* divide 递归 地 将 单词 划分 为 音节 , 它 带 4 个 参量 ,前 两 个 参量 为 一 给 定单 词 的 第 一 部 分 和 最 后 
一 部 分 ,后 两 个 参量 分 别 返 回 单词 分 解 成 音节 之 后 单词 的 第 一 部 分 和 最 后 一 部 分 。* / 
divide (Start, [T1,T2,T31Rest],D1, [T2,T31Rest]) :一 
vocal (T1) ,consonant (T2) ,vocal (T3), 
append (Start, [T1],D1) . 
divide (Start, [T1,T2,T3,T41Rest],Dl, [T3,T41Rest]) :一 
Vocal (T1) ,consonant (T2), 
consonant (T3) ,vocal (T4) ， 
append (Start, [T1, T2] ,D1). 
divide (Start, [Tl1|Rest] ,D1,D2):-— 
append (Start, [T1] ,Ss), 
divide (5S, Rest, D1,D2). 


/* 对 元 音 a,e,i,o,u 和 半 元 音 y 的 说 明 , 半 元 音 y 用 作 元 音 的 例子 有 : 
hyphen,pity,myrrh,martyr 等 。* / 


Vocal (a) ,vocal (e),vocal (i),vocal (0) ,vocal (u) ,vocal (Y) . 


/* 不 为 元 音 的 字母 即 为 辅音 。* / 


consonant (B) :- not (vocal (B)),B<=2z,a<B. 


/* 谓词 string word 将 一 个 串 转换 为 一 张 字符 表 , 其 中 谓词 bound (x) 成 功 的 条 件 是 :x 为 已 约束 
变量 。 谓 词 free (x) 成 功 的 条 件 是 :x 为 自由 变量 。*x / 
string word("™", []):-!. 
string word(Str, [HIT] :一 
bound (Str) ,frontstr (1, Str,H,S), 
string word(S,T). 
string _ word(Str, [HIT] :一 
free (Str) ,bound (H) ,string word(SvT)， 
concat (H,S, Str). 


/* append (L1,12,13) 成 功 的 条 件 是 :将 表 LI1 和 表 I2 拼接 起 来 等 于 表 L3。*/ 

append([],L,I) :- !. 

append ( [XIL1],12, [X1L3]) :- append(L1,I2,L3) - 

【思考 了 程序 中 采用 的 两 条 规则 对 大 多 数 单词 都 可 用 ,但 遇 到 像 handbook 之 类 的 单 
词 时 ,这 两 条 规则 就 不 可 用 了 。 对 这 类 单词 ,建议 采用 字库 划分 音节 。 
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8.3 句法 分 析 


句法 分 析 主 要 有 两 个 作用 : 一 是 对 句子 或 短语 结构 进行 分 析 , 以 确定 构成 句子 的 各 
个 词 .短语 之 间 的 关系 以 及 各 自在 句子 中 的 作用 等 ,并 将 这 些 关系 用 层次 结构 加 以 表达 ; 
二 是 对 句法 结构 进行 规范 化 。 在 对 一 个 句子 分 析 的 过 程 中 ,如 果 把 分 析 句 子 各 成 分 间 的 
关系 的 推导 过 程 用 树 形 图 表示 出 来 ,那么 这 种 图 称 为 句法 分 析 树 。 句 法 分 析 是 由 专门 设 
计 的 分 析 器 进行 的 ,其 过 程 就 是 构造 句法 树 的 过 程 ,将 每 个 输入 的 合法 语句 转换 为 一 棵 句 
法 分 析 树 。 

分 析 自 然 语 言 的 方法 主要 分 为 两 类 : 基于 规则 的 方法 和 基于 统计 的 方法 。 基 于 统计 
的 方法 将 在 后 面 章节 中 介绍 ,这 里 主要 介绍 基于 规则 的 各 种 方法 。 


8.3.1 短语 结构 文法 和 Chomsky 文法 体系 


短语 结构 文法 和 Chomsky 文法 是 描述 自然 语言 和 程序 设计 语言 强 有 力 的 形式 化 工 
具 , 可 用 于 在 计算 机 上 对 被 分 析 句 子 的 形式 化 进行 描述 和 分 析 。 

1. 短语 结构 文法 

短语 结构 文法 G 的 形式 化 定义 如 下 : 

G=(T,N,S,P) 
其 中 , 工 是 终结 符 的 集合 ,终结 符 是 指 被 定义 的 那个 语言 的 词 ( 或 符号 ); N 是 非 终结 符号 
的 集合 ,这 些 符号 不 能 出 现在 最 终生 成 的 句子 中 ,是 专门 用 来 描述 文法 的 。( 显 然 ,T 和 
NN 不 相交 ,T 和 N 共同 组 成 了 符号 集 V, 因 此 有 V=TU N,T 由 N=);S 是 起 始 符 ， 
它 是 集合 N 中 的 一 个 成 员 ; 已 是 产生 式 规则 集 。 每 条 产生 式 规则 都 具有 如 下 形式 : 
a>b 

其 中 ,a€ V+ ,bE V* ,a 隆 b,，V* 表示 由 V 中 的 符号 所 构成 的 全 部 符号 串 ( 包 括 空 符号 串 
中 ) 的 集合 , VT? 表示 V“ 中 除 空 符号 串 $ 外 的 一 切 符号 串 的 集合 。 

在 一 部 短语 结构 文法 中 ,基本 运算 就 是 把 一 个 符号 串 重 写 为 另 一 个 符号 串 。 如 果 
a0 是 一 条 产生 式 规则 ,那么 就 可 以 通过 用 0 置换 au , 重 写 任 何 一 个 包含 子 串 a 的 符号 
串 , 这 个 过 程 记 作 “二”。 所 以 ,如 果 u,v€ V* ,有 uav 过 ubv, 就 说 uav 直接 产生 ubv 或 
ubv 由 uav 直接 推导 得 出 。 以 不 同 的 顺序 使 用 产生 式 规则 ,就 可 以 从 同一 符号 产生 许多 
不 同 的 串 。 由 一 部 短语 结构 文法 定义 的 语言 L(G) 就 是 可 以 从 起 始 符 S 推导 出 符号 串 W 
的 集合 , 即 一 个 符号 串 要 属于 L(G) ,必须 满足 以 下 两 个 条 件 : 四 该 符号 串 只 包含 终结 符 ; 
加 该 符号 串 能 根据 文法 G 从 起 始 符 S 推导 出 来 。 

由 上 面 的 定义 可 以 看 出 ,采用 短语 结构 文法 定义 的 某 种 语言 是 由 一 系列 产生 式 组 成 
的 。 下 面 给 出 一 个 简单 的 短语 结构 文法 。 

例 8.1 G=(T,N,S,P) 

了 一 {the,man,killed,a,deer,likes} 

N=1{S,NP,VP,N,ART,V,Prep,PP} 

S=S 
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(1)S>NP+VP 
(2) NP>N 
(3) NP>ART+N 
(4) VP>V 
(5) VP>V+NP 
(6) ART—>thela 
(7) N—>man|deer 
(8) V—killed|likes 
2. Chomsky 定义 的 4 种 形式 文法 
根据 形式 文法 中 使 用 的 规则 集 ,Chomsky 定义 了 下 列 4 种 形式 的 文法 。 
(1) 无 约 东 短语 结构 文法 ,又 称 0 型 文法 。 
(2) 上 下 文 有 关 文 法 ,又 称 1 型 文法 。 
(3) 上 下 文 无 关 文 法 ,又 称 2 型 文法 。 
(4) 正则 文法 ,又 称 3 型 文法 。 
型 号 越 高 ,所 受 约束 越 多 ,生成 能 力 就 越 弱 , 能 生成 的 语言 集 就 越 小 ,也 就 是 说 ,型 号 
的 描述 能 力 就 越 弱 。 下 面 简要 讨论 这 儿 类 文法 。 
正则 文法 又 称 有 限 状 态 文法 ,只 能 生成 非常 简单 的 句子 。 
正则 文法 有 两 种 形式 : 左 线性 文法 和 右 线性 文法 。 在 一 部 左 线性 文法 中 ,所 有 规则 
都 必须 采用 如 下 形式 。 
A 一 Bl 或 4A 一 / 
其 中 ,A、BEN.1ET, 即 A、B 都 是 单独 的 非 终 结 符 ,t 是 单独 的 终结 符 。 而 在 一 部 右 
线性 文法 中 ,所 有 规则 都 必须 如 下 书写 : 
A 一 B 或 A 一 i 
上 下 文 无 关 文法 的 生成 能 力 略 强 于 正则 文法 。 在 一 部 上 下 文 无 关 文 法 中 ,每 一 条 规 
则 都 采用 如 下 形式 : 
A 一 工 
其 中 ,AEN,zEV* , 即 每 条 产生 式 规 则 的 左 侧 必须 是 一 个 单独 的 非 终 结 符 。 在 这 
种 体系 中 ,规则 被 应 用 时 不 依赖 于 符号 A 所 处 的 上 下 文 ,因此 称 为 上 下 文 无 关 文法 。 
上 下 文 有 关 文 法 是 一 种 满足 以 下 约束 的 短语 结构 文法 : 对 于 每 一 条 形式 为 
并 一 了 
的 产生 式 ,y 的 长 度 ( 即 符号 串 y 中 的 符号 个 数 ) 总 是 大 于 或 等 于 工 的 长 度 , 而 且 z、yEV' 。 
例如 ,AB-~>CDE 是 上 下 文 有 关 文法 中 一 条 合法 的 产生 式 , 但 ABC-~DE 不 是 。 
这 一 约 东 可 以 保证 上 下 文 有 关 文 法 是 递归 的 。 这 样 , 如 果 编 写 一 个 程序 ,在 读 入 一 个 
字符 串 后 能 最 终 判 断 出 这 个 字符 串 是 或 不 是 由 这 种 文法 所 定义 的 语言 中 的 一 个 句子 。 
自然 语言 是 一 种 与 上 下 文 有 关 的 语言 ,上 下 文 有 关 语 言 需 要 用 1 型 文法 描述 。 文 法 
规则 允许 其 左 部 有 多 个 符号 (至 少 包括 一 个 非 终结 符 ) ,以 指示 上 下 文 相关 性 , 即 上 下 文 有 
关 指 的 是 对 非 终结 符 进行 替换 时 需要 考虑 该 符号 所 处 的 上 下 文 环境 ,但 要 求 规则 的 右 部 
符号 的 个 数 不 少 于 左 部 ,以 确保 语言 的 递归 性 。 对 于 产生 式 : 
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aAb 一 ayb(AE N,y 关 $8,a 和 。 不 能 同时 为 $) 

当 用 y 替换 A 时 ,只 能 在 上 下 文 为 a 和 46 时 才 可 进行 。 

不 过 ,在 实际 中 ,由 于 上 下 文 无 关 语 言 的 句法 分 析 远 比 上 下 文 有 关 语 言 有 效 , 因 此 人 
们 希望 在 增强 上 下 文 无 关 语 言 的 句法 分 析 的 基础 上 ,实现 自然 语言 的 自动 理解 。 后 面 介 
绍 的 ATN 就 是 基于 这 种 思想 实现 的 一 种 自然 语言 句法 分 析 技 术 。 

如 果 不 对 短语 结构 文法 的 产生 式 规则 的 两 边 做 更 多 的 限制 ,而 仅 要 求 x 中 至 少 含有 
一 个 非 终结 符 ,那么 就 成 为 乔 姆 斯 基体 系 中 生成 能 力 最 强 的 一 种 形式 文法 , 即 无 约束 短语 
结构 文法 。 

rr>y(rEViI,yEV') 

0 型 文法 是 非 递 归 的 文法 , 即 无 法 在 读 入 一 个 字符 串 后 ,最 终 判断 出 这 个 字符 串 是 或 

不 是 由 这 种 文法 所 定义 的 语言 中 的 一 个 句子 。 因 此 ,0 型 文法 很 少 用 于 自然 语言 处 理 。 


8.3.2 句法 分 析 树 


在 对 一 个 句子 进行 分 析 的 过 程 中 ,如 果 把 分 析 句 子 各 成 分 间 关 系 的 推导 过 程 用 树 形 
图 表示 出 来 ,那么 这 种 图 称 为 句法 分 析 树 。 例 如 ,对 于 例 8. 1 的 文法 结构 ,该 文法 属于 上 
下 文 无 关 文法 ,利用 该 文法 对 下 面 的 句子 进行 分 析 
The man killed a deer. 
由 重 写 规 则 1 开始 得 到 下 面 的 分 析 过 程 : 
S 一 NP 十 VP 
一 ART 十 N 十 VP 
一 The man 十 VP 
一 The man 十 V 十 NP 
一 The man killed 十 NP 
一 The man killed 十 ART 十 N 
一 The man killed a deer 
上 述 例子 描述 了 一 个 自 上 向 下 的 推导 过 程 ,该 过 程 开 始 于 初始 符号 S, 然 后 不 断 地 选 
择 合适 的 重 写 规则 ,用 该 规则 的 右 部 代替 左 部 ,最 后 得 到 完整 的 句子 。 另 一 种 形式 的 推导 
称 为 自 下 向 上 的 过 程 ,该 过 程 开 始 于 所 要 分 析 的 句子 ,然后 用 重 写 规则 的 左 部 代替 右 部 ， 
直到 到 达 初 始 符号 S。 
对 应 的 句法 分 析 树 如 图 8-2 所 示 。 








sa VP 
ART A 

| | | > 0 
The man killed ART N 


图 8-2 句法 分 析 树 


用 83 竟 自然 语言 处 理 其 大 一 4 和 05 一 一 一 
在 句法 分 析 树 中 ,初始 符号 总 是 出 现在 树 根 上 ,终止 符号 则 是 出 现在 叶 上 。 
8.3.3 转移 网 络 
转移 网 络 在 自动 机 理论 中 用 来 表示 文法 。 句 法 分 析 中 的 转移 网 络 由 结 点 和 带 有 标记 


的 弧 组 成 , 结 点 表示 状态 , 弧 对 应 于 符号 ,基于 该 符号 ,可 以 实现 从 一 个 给 定 的 状态 转移 到 
男 一 个 状态 。 重 写 规则 和 相应 的 转移 网 络 如 图 8-3 所 示 。 











N 
(a) S 一 NP+VP 的 转移 网 络 (b) NP 一 ART+N 和 NP 一 N 的 转移 网 络 
V 


(OVP 一 V+NP 和 VP 一 V 的 转移 网 络 
图 8-3 重 写 规则 的 相应 的 转移 网 络 


用 转移 网 络 分 析 一 个 句子 ,首先 从 句子 S 开始 启动 转移 网 络 。 如 果 句 子 的 表示 形式 
和 转移 网 络 的 部 分 结构 (NP) 匹 配 ,那么 控制 会 转移 到 和 NP 相关 的 网 络 部 分 。 这 样 , 转 
移 网 络 进入 中 间 状 态 , 然 后 接着 检查 VP 短语 。 在 VP 的 转移 网 络 中 ,假设 整个 VP 匹配 
成 功 , 则 控制 会 转移 到 终止 状态 ,并 结束 。 例 如 ,句子 “the man laughed” 的 状态 转移 网 络 
如 图 8-4 所 示 , 其 中 虚线 上 的 数字 表示 转移 的 顺序 。 
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图 8-4 句子 “the man laughed” 的 状态 转移 网 络 


图 8-4 所 示 的 转移 网 络 含有 10 个 线段 ,表示 了 网 络 中 状态 的 控制 流 。 首 先 , 当 控制 
在 句子 的 So 发 现 NP 时 , 它 会 通过 虚线 1 移动 到 NP 转移 网 络 。 现 在 ,如 果 在 NP 转移 网 
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络 的 S 又 发 现 了 ART ,那么 通过 虚线 2 进入 ART 网 络 , 从 ART 网 络 选择 the, 然 后 通 
过 虚线 3 返回 NP 转移 网 络 的 S, 。 现 在 ,在 NP 转移 网 络 的 Si 找到 N, 通 过 弧 4 移动 到 
转移 网 络 N 的 初始 结 点 Se 。 该 过 程 一 直 这 样 进 行 下 去 ,直到 通过 弧 10 抵达 句子 的 转移 
网 络 的 S,。 

20 世纪 70 年 代 , W. Woods 提出 扩充 转移 网 络 (Augmented Transition Network， 
ATN) , 曾 应 用 于 他 著名 的 LUNAR 系统 中 ,后 来 ,Kaplan 对 其 做 了 一 些 改进 。ATN 文 
法 属于 一 种 增强 型 的 上 下 文 无 关 文 法 , 即 用 上 下 文 无 关 文 法 描述 句子 文法 结构 ,并 同时 提 
供 有 效 的 方式 将 各 种 理解 语句 所 需要 的 知识 加 到 分 析 系 统 中 ,以 增强 分 析 功 能 ,从 而 使 得 
应 用 ATN 的 句法 分 析 程序 具有 分 析 上 下 文 有 关 语言 的 能 力 。 

ATN 主要 是 对 转移 网 络 中 的 弧 附 加 了 过 程 而 得 到 的 。 当 通过 一 个 弧 的 时 候 , 附 加 
在 该 弧 上 的 过 程 就 会 被 执行 。 这 些 过 程 的 主要 功能 有 : @ 对 文法 特征 进行 赋值 ; @ 检 查 
数 (Number) 或 人 称 ( 第 一 、 二 或 三 人 称 ) 条 件 是 否 满足 ,并 据 此 允许 或 不 允许 转移 。 


8.4 语义 分 析 


句法 分 析 通 过 后 并 不 等 于 已 经 理解 了 所 分 析 的 句子 ,至少 还 需要 进行 语义 分 析 , 把 分 
析 得 到 的 句法 成 分 与 应 用 领域 中 的 目标 表示 相关 联 , 才 能 产生 正确 唯一 的 理解 。 简 单 的 
做 法 就 是 依次 使 用 独立 的 句法 分 析 程序 和 语义 解释 程序 。 这 样 做 的 问题 是 ,在 很 多 情况 
下 ,句法 分 析 和 语义 分 析 相 分 离 ,常常 无 法 决定 句子 的 结构 。ATN 允许 把 语义 信息 加 进 
句法 分 析 , 并 充分 支持 语义 解释 。 为 有 效 地 实现 语义 分 析 , 并 能 与 句法 分 析 紧 密 结合 , 研 
究 者 们 给 出 了 多 种 进行 语义 分 析 的 方法 ,这 里 主要 介绍 语义 文法 和 格 文法 。 





8.4.1 语义 文法 


语义 文法 是 将 文法 知识 和 语义 知识 组 合 起 来 ,以 统一 的 方式 定义 为 文法 规则 集 。 语 
义 文法 是 上 下 文 无 关 的 ,形态 上 与 面向 自然 语言 的 常见 文法 相同 ,只 是 不 采用 NP、VP 及 
PP 等 表示 句法 成 分 的 非 终 止 符 , 而 是 使 用 能 表示 语义 类 型 的 符号 ,从 而 可 以 定义 包含 语 
义 信息 的 文法 规则 。 

下 面 给 出 一 个 关于 舰 船 信息 的 例子 .从 此 例 可 以 看 出 语义 文法 在 语义 分 析 中 的 作用 。 

S>PRESENT the ATTRIBUTE of SHIP 

PRESENT—>what is |can you tell me 

ATTRIBUTE—>length | class 

SHIP>the SHIPNAME | CLASSNAME class ship 

SHIPNAME—~ Huanghe | Changjiang 

CLASSNAME—>carrier | submarine 

上 述 重 写 规则 从 形式 上 看 和 上 下 文 无 关 文法 是 一 样 的 。 其 中 ,用 全 是 大 写 英文 字母 
表示 的 单词 代表 非 终止 符 , 用 全 是 小 写 英文 字母 表示 的 单词 代表 终止 符 。 这 里 可 以 看 出 ， 
PRESENT 在 构成 句子 的 时 候 , 后 面 必须 紧 跟 单词 the, 这 种 单词 之 间 的 约束 关系 显然 表 
示 语 义 信 息 。 用 语义 文法 分 析 句 子 的 方法 与 普通 的 句法 分 析 文 法 类 似 , 特 别 是 同样 可 以 
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用 ATN 对 句子 做 语义 文法 分 析 。 

语义 文法 不 仅 可 以 排除 无 意义 的 句子 ,而 且 具 有 较 高 的 效率 ,对 语义 没有 影响 的 句法 
问题 可 以 忽略 。 但 是 ,该 文法 也 有 一 些 不 足 之 处 ,实际 应 用 时 需要 的 文法 规则 数量 往往 很 
大 ,因此 一 般 只 适用 于 严格 受到 限制 的 领域 。 


8.4.2 格 文法 


格 文法 是 由 Filimore 提出 的 ,主要 是 为 了 找 出 动词 和 与 它 处 在 结构 关系 中 的 名 词 的 
语义 关系 ,同时 也 涉及 动词 或 动词 短语 与 其 他 各 种 名 词 短语 之 间 的 关系 。 也 就 是 说 , 格 文 
法 的 特点 是 允许 以 动词 为 中 心 构造 分 析 结 果 ,尽管 文 法 规则 只 描述 句法 ,但 分 析 结 果 产 生 
的 结构 却 对 应 于 语义 关系 ,而 非 严 格 的 句法 关系 。 例 如 ,英语 句子 : 

Mary hit Bill 
的 格 文法 分 析 结 果 可 以 表示 为 

(hit (Agent Mary) 

(Dative Bill) ) 

这 种 表示 结构 称 为 格 文法 。 在 格 表示 中 ,一 个 语句 包含 的 名 词 词组 和 介词 词组 均 以 
它们 与 句子 中 动词 的 关系 表示 , 称 为 格 。 上 面 例子 中 的 Agent 和 Dative 都 是 格 , 而 像 
“(Agent Mary)" 这 样 的 基本 表示 称 为 格 结构 。 

在 传统 文法 中 , 格 仅 表示 一 个 词 或 短语 在 句子 中 的 功能 ,如 主格 、 宾 格 等 ,反映 的 也 只 
是 词尾 的 变化 规则 , 故 称 为 表层 格 。 在 格 文法 中 , 格 表示 的 语义 方面 的 关系 反映 的 是 句子 
中 包含 的 思想 ,观念 等 , 称 为 深层 格 。 和 短语 结构 文法 相 比 , 格 文法 对 句子 的 深层 语义 有 
更 好 的 描述 。 无 论 句子 的 表层 形式 如 何 变化 ,如 主动 语 态 变 为 被 动 语 态 ,陈述 句 变 为 疑问 
名 ,肯定 句 变 为 否定 句 等 ,其 底层 的 语义 关系 ,各 名 词 成 分 代表 的 格 关系 都 不 会 发 生 相应 
的 变化 。 例 如 ,被动 句 “Bill was hit by Mary” 与 上 述 主动 句 具有 不 同 的 句法 分 析 树 (图 
8-5) ,但 格 表示 完全 相同 ,这 说 明 这 两 个 句子 的 语义 相同 ,并 实现 多 对 一 的 源 -目的 映射 。 


p20 “ee NF VP 
| p> p00 
Mary NP Bill | 人 
hit Bill was hit by Mary 
Mary hit Bill Bill was hit by Mary 


图 8-5 ”主动 句 和 被 动 句 的 句法 分 析 


格 文法 和 类 型 层次 相 结合 ,可 以 从 语义 上 对 ATN 进行 解释 。 类 型 层次 描述 了 层次 
中 父子 之 间 的 子 集 关 系 。 根 据 层 次 中 事件 或 项 的 特 化 (specialized)/ 泛 化 (generalized) 关 
系 , 类 型 层次 在 构造 有 关 动 词 及 其 宾语 的 知识 ,或 者 确定 一 个 名 词 或 动词 的 意义 时 非常 
有 用 。 

在 类 型 层次 中 ,为 了 解释 ATN 的 意义 ,动词 具有 关键 的 作用 ,因此 可 以 使 用 格 文法 ， 
通过 动作 实施 的 工具 或 手段 描述 动作 主体 (Agent) 的 动作 。 例 如 ,动词 laugh 可 以 是 通 
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过 动作 主体 的 嘴唇 描 述 的 一 个 动作 , 它 可 以 带 给 自己 或 他 人 乐趣 。 因 此 ,laugh 可 以 表示 
为 下 面 的 格 框 架 ( 图 8-6)。 


Laugh eon) -| animal | 一 
-Cioe -| entity part 
lips 


图 8-6 动词 laugh 的 格 框架 
























































在 图 8-6 中 ,和 矩形 表示 世界 的 描述 ,两 个 矩形 之 间 的 关系 用 椭圆 表示 。 为 了 对 ATN 
进行 语义 解释 ,需要 指出 : 

(1) 当 从 ATN 中 的 句子 S 开始 分 析 时 ,需要 确定 名 词 短 语 和 动词 短语 ,以 得 到 名 词 
和 动词 的 格 框架 表示 。 将 名 词 和 对 应 格 框架 中 的 主语 (动作 主体 ) 关 联 在 一 起 。 

(2) 当 处 理 名 词 短语 时 ,需要 确定 名 词 ,确定 冠 词 的 数 特征 (是 单数 ,还 是 复数 ) ,并 将 
动作 的 制造 者 和 名 词 相 关联 。 

(3) 当 处 理 动词 短语 时 ,需要 确定 动词 。 如 果 动 词 是 及 物 的 , 则 找到 其 对 应 的 名 词 短 
语 ,并 说 明 它 为 动词 的 施加 对 象 。 

(4) 当 处 理 动词 时 ,检索 它 的 格 框架 。 

(5) 当 处 理 名 词 时 ,检索 它 的 格 框架 。 

格 文法 是 一 种 有 效 的 语义 分 析 方 法 , 它 有 助 于 删除 句法 分 析 的 歧义 性 ,并 且 易 于 使 
用 。 格 表示 易于 用 语义 网 络 表示 法 描述 ,从 而 多 个 句子 的 格 表示 相互 关联 形成 大 的 语义 
网 络 ,以 便 开 发 句子 间 的 关系 ,理解 多 句 构 成 的 上 下 文 , 并 用 于 回答 问题 。 


8.5 大 规模 真实 文本 的 处 理 


8.5.1 语料库 语言 学 及 其 特点 


传统 的 句法 -语义 分 析 主要 是 基于 规则 的 方法 。 这 主要 是 因为 语言 学 家 首先 是 从 规 
则 着 手 ,而 不 是 从 统计 角度 认识 和 处 理 语言 的 。 由 于 自然 语言 理解 的 复杂 性 ,各 种 知识 的 
“数量 ?浩瀚 无 际 ,而 且 具 有 高 度 的 不 确定 性 和 模糊 性 ,利用 规则 不 可 能 完全 准确 地 表达 理 
解 自 然 语 言 所 需 的 各 种 知识 ,而 且 规 则 实际 上 是 面向 语言 的 使 用 者 (人 ) 的 ,因此 若 将 它 面 
向 机 器 , 则 分 析 结果 始终 不 尽 如 人 意 。 由 此 ,机 器 翻译 应 强调 理解 ,单纯 依靠 规则 方法 ,也 
曾经 使 机 器 翻译 一 度 陷入 低谷 。 

1990 年 8 月 ,在 赫尔辛基 召开 的 第 13 届 国 际 计算 机 语言 学 大 会 上 ,大 会 组 织 者 提出 
了 处 理 大 规模 真实 文本 将 是 今后 一 个 相当 长 时 期 内 的 战略 目标 。 为 实现 战略 目标 的 转 
移 ,需要 在 理论 .方法 和 工具 等 方面 实行 重大 的 革新 。 这 种 建立 在 大 规模 真实 文本 基础 上 
的 研究 方法 将 自然 语言 处 理 的 研究 推 向 一 个 办 新 的 阶段 。 理 解 自然 语言 所 需 的 各 种 知识 


务 8 葛 自然 语言 处 理 共 太一 一 409 一 一 一 
恰恰 蕴涵 在 大 量 的 真实 文本 中 ,通过 相应 的 知识 库 , 从 而 实现 以 知识 为 基础 的 智能 型 自然 
语言 理解 系统 。 研 究 语言 知识 所 用 的 各 种 知识 ,就 必须 对 语料库 进行 适当 的 处 理 与 加 工 ， 
使 之 由 “ 生 ” 语 料 变 为 有 价值 的 “ 熟 " 语 料 。 这 样 就 形成 了 一 门 新 的 学 科 一 一 语料库 语言 学 
(corpus linguistics) ,可 用 于 对 自然 语言 理解 进行 研究 。 

语料库 (corpus) 指 存储 语言 材料 的 仓库 。 现 代 的 语料库 是 指 存放 在 计算 机 里 的 原始 
语 料 文本 或 经 过 加 工 后 带 有 语言 学 信息 标注 的 语 料 文本 。 

关于 语料库 的 三 点 基本 认识 : 语料库 中 存放 的 是 在 语言 的 实际 使 用 中 真实 出 现 过 
的 语言 材料 ; 四 语料库 是 以 电子 计算 机 为 载体 承载 语言 知识 的 基础 资源 ; @@ 真 实 语 料 需 
要 经 过 加 工 ( 分 析 和 处 理 ) ,才能 成 为 有 用 的 资源 。 

下 面 以 WordNet 为 例 说 明 语料库 中 包括 什么 样 的 语义 信息 。WordNet 是 1990 年 
由 Princeton 大 学 的 Miller 等 人 设计 和 构造 的 。 一 部 WordNet 词典 将 近 95 600 个 词 形 
(51 500 单词 和 44 100 搭配 词 ) 和 70 100 个 词义 ,分 为 5 类 : 名词. 动词 形容词. 副 词 和 
虚词 , 按 语义 而 不 是 按 词性 组 织 词汇 信息 。 在 WordNet 词典 中 ,名 词 有 57 000 个 ,含有 
48 800 个 同义词 集 ,分 成 25 类 文件 ,平均 深度 12 层 。 最 高 层 为 根 概念 ,不 含有 固有 名 词 。 

传统 的 词典 通常 是 把 各 类 不 同 的 信息 放 入 一 个 词汇 单元 中 加 以 解释 ,包括 拼音 、 读 
音 . 词 形变 化 及 派生 词 .词根 ,短语 .时 态 变换 的 定义 及 说 明 .同义词 反义词 ,特殊 用 法 注 
释 , 偶 尔 还 有 图 示 或 插图 ,包含 相当 可 观 的 信息 存储 。 但 是 , 它 还 有 一 些 不 足 ,特别 是 用 在 
自然 语言 理解 时 更 显得 不 够 。 

以 名 词 “ 树 ”为 例 , 传 统 的 词典 一 般 解 释 为 : 一 种 大 型 的 、 木 制 的 、 多 年 生长 的 .具有 明 
显 树 干 的 植物 。 基 本 上 是 上 位 词 加 上 辨别 特征 。 但 是 ,这 还 不 够 ,还 缺少 一 些 信息 。 例 
如 ,第 一 , 它 没有 谈 到 树 有 根 , 有 植物 纤维 壁 组 成 的 细胞 ,甚至 也 没有 提 及 它们 是 生命 的 组 
织 形式 。 但 是 ,在 WordNet 中 ,只 要 查 一 下 它 的 上 位 词 “植物 ”, 就 可 以 找到 这 些 信息 。 第 
二 , 树 的 定义 没有 包括 对 等 词 的 信息 ,不 能 推测 其 他 种 类 的 植物 存在 的 可 能 性 。 第 三 ,对 
于 各 种 树 都 感 兴趣 的 读者 ,除了 查 遍 词典 ,没有 别 的 办 法 。 第 四 ,每 个 人 对 树 都 有 自己 的 
认识 ,而 词典 的 编撰 者 又 没有 将 其 写 在 树 的 定义 中 ,如 树 包 括 树 皮 、 树 枝 ; 树 由 种 子 生长 而 
成 等 。 

可 以 看 出 ,普通 词典 中 遗漏 的 信息 中 大 部 分 是 关于 构造 性 的 信息 ,而 不 是 事实 性 的 
信息 。 

WordNet 是 按 一 定 结 构 组 织 起 来 的 语义 类 词典 ,主要 特征 表现 如 下 。 

1) 整个 名 词组 成 一 个 继承 关系 

WordNet 有 着 严格 的 层次 关系 ,这 样 一 个 单词 可 以 把 它 所 有 的 前 辈 的 一 般 性 的 上 位 
词 的 信息 都 继承 下 来 ,可 以 提供 全 局 性 的 语义 关系 ,具有 IS-A 关系 。 

2) 动词 是 一 个 语义 网 

表达 动词 的 意义 对 任何 词汇 语言 学 来 说 都 是 困难 的 。WordNet 不 做 成 分 分 析 ,而 是 
进行 关系 分 析 。 这 一 点 是 计算 语言 学 界 热衷 的 课题 ,与 以 往 的 语义 分 析 方法 不 同 , 这 种 关 
系 讨论 的 是 动词 间 的 纵向 关系 , 即 词汇 蕴涵 关系 。 

为 了 对 自然 语言 理解 进行 研究 ,需要 优先 考虑 的 问题 主要 是 大 规模 真实 语料库 的 建 
设 和 大 规模 、 信 息 丰 富 的 机 读 词 典 的 编制 方法 的 研究 。 

大 规模 真实 文本 处 理 的 数学 方法 主要 是 统计 方法 ,大 规模 的 经 过 不 同 深度 加 工 的 真 
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实 文本 的 语料库 的 建设 是 基于 统计 性 质 的 基础 。 如 何 设计 语料库 ,如 何 对 生 语 料 进行 不 
同 深度 的 加 工 以 及 加 工 语 料 的 方法 等 , 正 是 语料库 语言 学 要 深入 进行 研究 的 内 容 。 

规模 为 几 万 、 十 几 万 甚至 几 十 万 的 词 .含有 丰富 的 信息 (如 包含 词 的 搭配 信息 、 文 法 
信息 等 ) 的 计算 机 可 用 词典 ,对 自然 语言 的 处 理 系 统 的 作用 是 很 明显 的 。 采 用 什么 样 的 词 
典 结构 ,包含 词 的 哪些 信息 ,如 何 对 词 进行 选择 ,如 何以 大 规模 语 料 为 资料 建立 词典 , 即 如 
何 从 大 规模 语 料 中 获取 词 等 都 需要 进行 深入 的 研究 。 

基于 大 规模 真实 文本 处 理 的 语料库 语言 学 与 传统 的 基于 句法 -语义 分 析 的 方法 比较 ， 
有 以 下 特点 : 

(1) 试验 规模 不 同 。 以 往 的 自然 语言 处 理 系统 多 数 都 是 利用 细心 选择 过 的 少数 例子 
进行 试验 ,而 现在 要 处 理 从 多 种 出 版 物 上 收录 的 数 以 百 万 计 的 真实 文本 。 这 种 处 理 在 深 
度 方面 虽然 可 能 不 深 ,但 针对 特定 的 任务 还 是 有 实用 价值 的 。 

(2) 文法 分 析 的 范围 要 求 不 同 。 由 于 真实 文本 的 复杂 性 (其 中 甚至 有 不 合 文法 的 句 
子 ), 对 所 有 的 句子 都 要 求 完 全 的 文法 分 析 几 乎 是 不 可 能 的 ,同时 ,由 于 具体 文章 的 数量 极 
大 ,还 有 处 理 速 度 方面 的 要 求 。 因 此 ,目前 的 多 数 系统 往往 不 要 求 完全 的 分 析 , 只 要 求 对 
必要 的 部 分 进行 分 析 。 

(3) 处 理 方法 的 不 同 。 以 往 的 系统 主要 依赖 语言 学 的 理论 和 方法 , 即 是 基于 规则 的 
方法 ,而 新 的 基于 大 规模 真实 文本 处 理 而 开发 的 系统 ,同时 还 依赖 于 对 大 量 文 本 的 统计 性 
质 分 析 。 统 计 学 的 方法 在 新 研制 的 系统 中 起 了 很 大 的 作用 。 

(4) 所 处 理 的 文本 涉及 的 领域 不 同 。 以 往 的 系统 往往 只 针对 某 一 较 窗 的 领域 ,而 现 
在 的 系统 则 适合 较 宽 的 领域 ,甚至 是 与 领域 无 关 的 , 即 系统 工作 时 并 不 需要 用 到 与 特定 领 
域 有 关 的 领域 知识 。 

(5) 对 系统 评价 方式 的 不 同 。 对 系统 的 评价 不 再 是 只 用 少量 的 人 为 设计 的 例子 对 系 
统 进行 评价 ,而 是 根据 系统 的 应 用 要 求 ,对 其 性 能 进行 评价 , 即 用 真实 文本 进行 较 大 规模 
的 、 客 观 的 和 定量 的 评价 ,不 仅 要 注意 系统 的 质量 ,而 且 也 要 注意 系统 的 处 理 速度 。 

(6) 系统 面向 的 应 用 不 同 。 以 前 的 某 些 系统 可 能 适合 对 “故事 "性 的 文本 进行 处 理 ， 
而 基于 大 规模 真实 语 料 的 自然 语言 理解 系统 要 走向 实用 化 ,需要 对 大 量 的 、 真 实 的 新 闻 语 
料 进行 处 理 。 

(7) 文本 格式 的 不 同 。 以 往 处 理 的 文本 只 是 一 些 纯 文本 ,而 现在 要 面向 真实 的 文本 。 
真实 文本 大 多 都 是 经 过 文字 处 理 软件 处 理 以 后 含有 排版 信息 的 文本 。 因 而 ,如 何 处 理 含 
有 排版 信息 的 文本 就 应 该 受到 重视 。 


8.5.2 统计 学 方法 的 应 用 及 所 面临 的 问题 


20 世纪 90 年 代 , 自 然 语言 理解 的 研究 在 基于 规则 的 技术 中 引入 语料库 的 方法 ,其 中 
包括 统计 方法 、 基 于 实例 的 方法 和 通过 语 料 加 工 手段 使 语料库 转化 为 语言 知识 库 的 方法 
等 。 使 用 统计 的 方法 ,使 机 器 翻译 的 正确 率 达 到 60% ,汉语 切 分 的 正确 率 达 到 70% ,汉语 
语音 输入 的 正确 率 达 到 80% ,这 是 对 传统 语言 学 的 严重 挑战 。 许 多 研究 人 员 相 信 , 基 于 
语料库 的 统计 模型 (如 n-gram 模型 、Markov 模型 .向 量 空间 模型 ) 不 仅 能 胜任 词类 的 自 
动 标注 任务 ,而 且 也 能 够 应 用 到 句法 和 语义 等 更 高 层次 的 分 析 上 。 这 种 方法 有 和 希望 在 工 
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程 上 \ 在 宽广 的 语言 覆盖 面 上 解决 大 规模 真实 文本 处 理 这 一 极其 艰巨 的 课题 ,至 少 也 能 对 
基于 规则 的 自然 语言 处 理 系统 提供 一 种 强 有 力 的 补充 机 制 。 

当前 语言 学 处 理 的 一 个 总 的 趋势 是 部 分 分 析 代 蔡 全 分 析 ,部 分 理解 代替 全 理解 ,部 分 
翻译 代替 全 翻译 。 从 大 规模 真实 语料库 中 获取 语言 信息 知识 的 方法 一 般 采 用 数学 上 的 统 
计 方 法 ,并 基于 此 构造 了 大 量 的 语料库 。 统 计 方法 就 是 这 样 一 种 * 部 分 分 析 代 蔡 全 分 析 ” 
趋势 中 的 产物 。 统 计 方法 初期 ,其 主要 成 果 比 较 集中 在 词 层 的 处 理 上 ,如 汉语 分 词 . 词 性 
标注 等 。 但 是 ,在 句法 层次 的 语言 分 析 方面 ,目前 还 正在 研究 。 另 外 ,统计 方法 在 理解 自 
然 语言 时 主要 是 和 分 析 方 法 相 结 合 使 用 的 。 

随 着 语料库 语言 学 的 快速 发 展 ,一 个 值得 注意 的 研究 方法 是 ,随机 语言 模型 的 建 模 工 
作 正 在 由 基本 的 线性 词汇 统计 转向 结构 化 的 句法 领域 ,尝试 以 此 为 基础 解决 句法 结构 的 
歧义 性 问题 。 结 构 化 语言 模型 的 基本 思想 是 ,根据 语 料 统计 信息 建立 一 定 的 优先 评价 机 
制 , 对 输入 句子 的 分 析 结 果 进 行 概率 计算 ,从 而 得 到 概率 意义 上 的 最 优 分 析 结 构 。 

最 初出 现 的 结构 化 语言 模型 是 20 世纪 60 年 代 末 在 语音 识别 研究 中 提出 的 概率 上 下 
文 无 关 文 法 (Probabilistic Context Free Grammar, PCFG) ,但 是 直到 1979 年 Backer 提出 
Inside-Outside 算法 解决 了 PCFG 文法 的 参数 自动 获取 问题 以 后 ,PCFG 才 得 到 进一步 的 
研究 ,并 出 现 了 一 些 有 用 的 成 果 , 如 更 为 有 效 的 PCFG 分 析 技 术 、 改 进 的 1/0 算法 及 针对 
大 型 文法 分 析 的 概率 剪 枝 技 术 等 。 

PCFG 模型 的 不 足 在 于 其 词汇 化 程度 很 差 ,模型 参数 仅 能 得 到 微弱 的 上 下 文 信息 , 整 
个 系统 具有 很 大 的 炉 。 随 着 大 规模 带 标注 语料库 ,尤其 是 具有 结构 化 标注 信息 的 树 库 的 
建立 ,研究 者 们 开始 使 用 各 种 有 监督 的 学 习 机 制 ,构造 更 为 复杂 的 语言 模型 ,如 基于 决策 
树 的 方法 .基于 词汇 关联 信息 的 语言 模型 等 。 

除了 随机 结构 化 语言 模型 外 ,加 大 语言 处 理 基 本 单元 的 力度 也 是 重要 的 发 展 趋势 。 
在 这 种 研究 中 ,多 义 的 单词 加 大 到 单 义 的 语 段 (chunk) 这 个 层次 ,并 给 以 中 心 词 的 标注 ， 
目的 是 为 了 简化 处 理 的 句 型 ,化 解 机 器 翻译 的 歧义 问题 。 





8.5.3 汉语 语料库 加 工 的 基本 方法 


书面 汉语 不 同 于 英语 法语 、 德 语 等 印 欧 语言 , 词 与 词 之 间 没 有 空格 。 在 汉语 自然 语 
言 处 理 中 ,凡是 涉及 句法 .语义 的 研究 项 目 , 都 要 以 词 为 基本 单位 进行 。 句 法 研究 组 词 成 
句 的 规律 。 词 是 汉语 文法 和 语义 研究 的 中 心 问题 ,也 是 汉语 自然 语言 处 理 的 关键 问题 。 

目前 ,对 大 规模 汉语 语料库 的 加 工 主 要 包括 自动 分 词 和 标注 (包括 词性 标注 和 词义 标 
注 )。 这 里 仅 就 汉语 文本 自动 分 词 及 标注 的 方法 进行 简单 概述 。 

1. 汉语 自动 分 词 

1) 汉语 自动 分 词 方法 

汉语 自动 分 词 方 法 主要 以 基于 词典 的 机 械 匹 配 分 词 方法 为 主 。 近 年 来 ,也 有 人 提出 
无 词典 分 词法 、 基 于 专家 系统 和 人 工 神经 网 络 的 分 词 方法 。 这 里 主要 介绍 常用 基于 词典 
的 机 械 匹 配 分 词法 。 

Oa 最 大 匹配 法 。 最 大 匹配 法 (maximum matching method) 有 时 也 称 作 正 向 最 大 匹 
配 法 ,简称 MM 方法 。 其 思想 是 : 在 计算 机 磁盘 中 存放 一 个 分 词 用 词典 ,从 待 切 分 的 文 
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本 中 按 自 左 到 右 的 顺序 截取 一 个 定 长 的 汉字 串 ,通常 为 6 一 8 个 汉字 (或 长 度 为 词典 中 的 
最 大 词 长 ) ,这 个 字符 串 的 长 度 称 作 最 大 词 长 。 将 这 个 具有 最 大 词 长 的 字符 串 与 词典 中 的 
词 进行 匹配 , 若 匹配 成 功 , 则 可 确定 这 个 字符 串 为 词 , 计 算 机 程序 的 指针 向 后 移动 与 给 定 
最 大 词 长 相应 个 数 的 汉字 ,继续 进行 匹配 ;否则 ,把 该 字符 串 从 右边 逐次 减 去 一 个 汉字 ,再 
与 词典 中 的 词 进行 匹配 ,直到 成 功 为 止 。 

@ 道 向 最 大 匹配 法 。 道 向 最 大 匹配 法 (reverse maximum matching method) 简称 
RMM 法 。 这 种 方法 的 基本 原理 与 MM 法 相同 ,不 同 的 是 分 词 时 对 待 切 分 文本 的 扫描 方 
向 。MM 方法 从 待 切 分 文本 中 截取 字符 串 的 方向 是 从 左 到 右 ,而 RMM 方法 则 是 从 右 到 
左 。 在 与 词典 匹配 不 成 功 时 ,将 所 截取 的 汉字 串 从 左 至 右 逐 次 减 去 一 个 汉字 ,再 与 词典 中 
的 词 进行 匹配 ,直到 匹配 成 功 为 止 。 实 验 表 明 ,RMM 法 的 切 词 正确 率 要 比 MM 法 高 。 

@ 逐 词 遍历 匹配 法 。 逐 词 遍历 匹配 法 是 把 词典 中 存放 的 词 按 由 长 到 短 的 顺序 ,逐个 
与 待 切 分 的 语 料 文本 进行 匹配 ,直到 把 文本 中 的 所 有 词 都 切 分 出 来 为 止 。 由 于 这 种 方法 
要 把 词典 中 的 每 一 个 词 都 匹配 一 遍 , 因 此 需要 花费 很 多 时 间 , 算 法 的 时 间 复 杂 度 相应 增 
加 , 切 词 速度 较 慢 , 切 词 的 效率 不 高 。 

以 上 这 3 种 方法 是 最 基本 的 机 械 性 切 词 方 法 。 还 有 一 些 方法 都 是 在 这 3 种 方法 基础 
上 的 一 些 改进 ,这 些 方法 包括 双向 扫描 法 、 设 立 切 分 标志 法 及 最 佳 匹配 法 等 。 

2) 自动 分 词 词 不 达意 的 难点 

汉语 分 词 在 汉语 自然 语言 理解 中 起 着 举足轻重 的 作用 。 尽 管 经 过 多 年 的 研究 ,汉语 
分 词 技术 取得 了 很 大 的 成 绩 , 但 距 实际 应 用 的 要 求 仍 还 有 很 大 的 距离 。 主 要 原因 是 在 分 
词 时 ,语言 学 家 靠 的 是 “语感 ”, 没 有 什么 形式 的 定义 。 普 通 人 的 语感 和 专家 的 语感 不 同 ， 
前 者 * 宽 ”, 后 者 * 严 ”, 搞 古文 训 读 的 专家 更 “ 严 ”, 把 一 些 常 作为 “ 词 ”的 成 分 进行 再 次 分 解 。 

因此 ,在 汉语 中 , 词 的 概念 问题 是 分 词 的 难点 之 一 。 在 汉语 语言 学 中 ,有 关 “ 词 ”的 概 
念 还 没有 完全 和 弄 清 。“ 词 是 什么 ”( 词 的 抽象 定义 ) 及 “什么 是 词 ”( 词 的 具体 界定 ) ,这 两 个 
基本 问题 有 点 飘忽 不 定 ,一 直 没 有 定论 ,从 而 致使 至 今 仍 拿 不 出 一 个 公认 的 .具有 权威 性 
的 分 词 用 词 表 。 主 要 的 困难 表现 在 两 个 方面 : 一 方面 是 单字 词 与 语素 之 间 的 区 别 ; 男 一 
方面 是 词 与 短语 (词组 ) 的 区 别 。 

汉语 分 词 的 其 他 难点 主要 有 以 下 两 方面 : 四 分 词 过 程 中 的 歧义 问题 。@ 未 登录 词 的 
识别 问题 。 未 登录 词 是 指 没 有 在 词典 中 出 现 、 在 汉语 文本 中 又 应 该 当 作 一 个 词 将 其 分 开 
的 那些 字符 串 ,包括 中 外 人 名 、 中 外 地 名 、 机 构 组 织 名 、 事 件 名 、 缩 略语 、 派 生词 .各 种 专业 
术语 以 及 不 断 发 展 和 约定 俗 成 的 一 些 新 词语 。 

2. 汉语 词性 标注 

1) 词性 标注 的 意义 

词性 标注 就 是 在 给 定 句子 中 判定 每 个 词 的 文法 范畴 ,确定 其 词性 并 加 以 标注 的 过 程 。 
设 定 词 性 的 词汇 是 构造 语 段 的 基础 ,但 是 词性 兼 类 是 英汉 机 器 翻译 中 典型 的 歧义 现象 ,如 
果 预 料 的 词性 能 自动 标注 ,那么 歧义 问题 就 好 解决 了 。 在 自然 语言 处 理 中 ,研究 词性 自动 
标注 的 目的 主要 是 : 第 一 ,为 了 对 文本 进行 文法 分 析 或 句法 分 析 等 更 高 层次 的 文本 加 工 
提供 基础 ,以 便 在 文摘 、 自 动 校对 、OCR 识别 后 处 理 等 应 用 系统 开发 中 提高 准确 率 ;第 二 ， 
通过 对 标注 过 的 语 料 进 行 统计 分 析 等 处 理 , 可 以 抽取 蕴涵 在 文本 中 的 语言 知识 ,为 语言 学 
的 研究 提供 可 靠 的 数据 ,同时 ,又 可 以 进一步 运用 这 些 知 识 , 改 进 词性 标注 系统 ,提高 词性 
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标注 系统 的 准确 率 。 

2) 词性 标注 的 难点 

词性 标注 的 难点 主要 是 兼 类 词 的 自动 词类 歧义 排除 。 所 谓 兼 类 词 , 是 指 那些 具有 两 
个 或 两 个 以 上 词性 的 词 。 由 于 汉语 是 一 种 没有 词 的 形态 的 变化 语言 , 词 的 类 别 不 能 像 印 
欧 语 一 样 直 接 由 词 的 形态 判断 ,再 加 上 常用 词 的 兼 类 现象 严重 等 因素 ,因此 要 确定 一 个 词 
在 文本 中 的 词性 有 时 是 很 困难 的 。 

3) 词性 标注 方法 

词性 标注 的 方法 主要 就 是 兼 类 词 的 歧义 排除 方法 。 目 前 的 方法 主要 有 两 大 类 : 一 类 
是 基于 概率 统计 模型 的 词性 标注 方法 ; 另 一 类 是 基于 规则 的 词性 标注 方法 。 

O@ 基于 概率 统计 模型 词性 标注 的 代表 性 系统 有 CLAWS 系统 , 它 采 用 统计 模型 消除 
兼 类 词 歧义 ,使 自动 标注 的 准确 率 达到 96%。1988 年 ,S.J. DeRose 对 CLAWS 系统 做 了 
一 些 改进 ,利用 线性 规划 的 方法 降低 系统 的 复杂 性 ,提出 了 VOLSUNGA 算法 ,大 大 提高 
了 处 理 效 率 , 使 自动 词性 标注 的 正确 率 达 到 了 实用 的 水 平 。 基 于 语料库 的 统计 方法 目前 
不 仅 用 于 词性 自动 标注 ,而 且 已 应 用 到 句法 和 语义 等 更 高 层次 的 分 析 上 了 。 

@ 基于 规则 的 方法 的 代表 性 系统 有 Greene 和 Robin 出 于 语言 学 的 目的 ,于 1977 年 
设计 的 词性 标注 系统 TAGGIT。 该 系统 采用 基于 上 下 文 框架 规则 的 方法 ,使 用 了 具有 86 
个 标记 的 标记 集 和 用 于 排除 兼 类 词 歧义 的 3300 条 上 下 文 框架 规则 ,对 美国 的 BROWN 
语料库 进行 标记 ,准确 率 为 77%。 但 是 ,规则 的 方法 是 十 分 繁杂 的 ,编写 和 维护 也 是 一 个 
很 大 的 问题 。1992 年 ,美国 宾 州 大 学 Brill 提出 了 一 种 基于 转换 的 错误 驱动 学 习 机 制 ,从 
带 标 语料库 中 自动 获取 转换 规则 以 用 于 词性 的 自动 标注 ,所 建立 的 基于 规则 的 词性 标注 
系统 的 标注 准确 率 大 大 提高 ,获得 了 与 基于 统计 模型 同样 高 的 准确 率 。 

4) 汉语 句法 分 析 

句法 分 析 能 够 对 自然 语言 进行 更 深层 的 、 智 能 化 的 处 理 。 基 于 词汇 化 的 概率 上 下 文 
无 关 文 法 (Lexicalized Probabilistic Context-Free Grammar, LPCFG) 是 一 种 广 为 流 行 的 
用 于 句法 分 析 的 文法 。 这 种 文法 是 一 种 短语 结构 文法 ,因此 LPCFG 句法 分 析 器 的 输出 
结果 是 句子 的 短语 句法 结构 。 费 铁 亮 和 穗 志方 提出 了 词汇 化 句法 分 析 与 子 语 类 框架 获取 
的 互动 方法 概率 句法 分 析 方 法 ,引入 了 动词 子 类 信息 作为 一 类 重要 词汇 化 信息 。 该 方法 
将 谓语 动词 的 子 语 类 信息 与 概率 句法 分 析 结 合 起 来 ,建立 了 基于 汉语 动词 子 语 类 框架 的 
统计 句法 分 析 模 型 ,并且 针 对 动词 子 语 类 框架 难以 获取 的 问题 ,提出 一 种 词汇 化 概率 句法 
分 析 与 动词 子 语 类 框架 获取 的 互动 方法 。 张 亮 和 陈 家 骏 提出 了 基于 大 规模 语料库 的 句法 
模式 匹配 方法 。 通 过 大 量 记录 的 正确 处 理 实例 的 分 析 过 程 和 结果 ,在 句法 分 析 时 ,搜寻 近 
似 实 例 或 片段 ,匹配 相似 语言 结构 和 分 析 过 程 ,其 句法 分 析 过 程 体现 了 “语言 分 析 依 赖 经 
验 ” 的 思想 。 

3. 汉语 词义 标注 

1) 词义 标注 的 意义 

词义 标注 就 是 对 文本 中 的 每 个 词根 据 其 所 属 上 下 文 给 出 它 的 语义 编码 ,这 个 编码 可 
以 是 词典 释义 文本 中 的 某 个 义 项 号 ,也 可 以 是 义 类 词典 中 相应 的 义 类 编码 。 自 动词 义 标 
注 就 是 利用 计算 机 通过 逻辑 推理 机 制 , 利 用 文本 的 上 下 文 环境 ,对 词 的 词义 进行 自动 判 
断 , 选 择 词 的 某 一 正确 义 项 并 加 以 标注 的 过 程 。 研 究 词义 自动 标注 除了 对 语言 学 研究 有 
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重要 意义 外 ,在 自然 语言 处 理 的 很 多 领域 都 有 非常 重要 的 作用 ,如 语音 合成 情报 检索 、 机 
器 翻译 、 自 动 校对 及 OCR 识别 后 处 理 等 。 所 以 ,词义 标注 是 当前 自然 语言 信息 处 理 的 一 





个 热门 课题 。 

2) 词义 标注 的 难点 

词义 标注 的 难点 就 是 对 多 义 词 的 歧义 排除 。 一 词 多 义 的 现象 普遍 存在 ,要 确定 一 个 
词 的 词义 一 定 要 依据 上 下 文 环境 ,如 果 没 有 上 下 文 环境 ,即使 是 人 ,也 很 难 确定 一 个 词 的 
词义 ,更 何况 由 计算 机 标注 。 


3) 词义 标注 方法 

目前 ,多 义 词 排 歧 的 研究 尚 处 于 初级 阶段 。 英 语 的 多 义 词 排 歧 的 方法 主要 有 人 工 智 
能 方法 、 基 于 词典 的 方法 和 基于 语料库 的 方法 。 近 年 来 ,统计 概率 模型 在 词性 标注 方面 的 
成 功 , 以 及 网 络 技术 的 发 展 ,使 得 语料库 在 选材 人 库 上 易于 实现 , 越 来 越 多 的 研究 转向 了 
基于 语料库 的 概率 统计 方法 。 

4) 语义 角色 标注 

语义 角色 标注 也 称 为 浅 层 语义 分 析 。 目 前 国内 外 语义 分 析 研 究 主要 集中 在 语义 角色 
标注 (Semantic Role Labeling,SRL) 研 究 上 。 在 语义 角色 标注 中 ,大 量 应 用 统计 机 器 学 习 
方法 。 其 中 ,有 监督 机 器 学 习 方法 受 限于 标注 语 料 的 规模 ,在 小 规模 标注 样本 中 难以 获取 
较 高 性 能 。 陈 炊 东 、 王 挺 和 陈 火 旺 面向 浅 层 语义 分 析 任 务 , 采 用 了 一 种 新 颖 的 半 监 督学 习 
方法 一 一 直 推 式 支持 向 量 机 ,并 结合 其 训练 特点 提出 了 基于 主动 学 习 的 样本 优化 策略 。 
该 方法 通过 整合 主动 学 习 与 半 监 督学 习 , 在 小 规模 标注 样本 环境 中 取得 了 良好 的 学 习 效 
果 。 语 义 角色 可 用 于 各 种 语义 分 析 和 语 篇 分 析 中 。 

庄 成 龙 、 钱 龙华 和 周 国 栋 对 于 基于 树 核 函数 的 实体 语义 关系 抽取 方法 进行 了 研究 , 描 
述 了 一 种 改进 的 基于 树 核 函数 的 实体 语义 关系 抽取 方法 ,通过 在 原 有 关系 实例 的 结构 化 
信息 中 加 入 实体 语义 信息 和 去 除 元 余 信息 的 方法 提高 语义 关系 抽取 的 性 能 。 


8.5.4 语义 资源 建设 


语料库 和 词汇 知识 库 在 不 同 层面 共同 构成 了 自然 语言 处 理 各 种 方法 赖 以 实现 的 基 
础 ,有 时 其 至 是 建立 或 改进 一 个 自然 语言 处 理 系统 的 关键 。 因 此 ,世界 各 国 对 语料库 和 语 
言 知识 库 开发 都 投入 了 极 大 的 关注 。 自 1979 年 以 来 ,中 国 开 始 进 行 机 读 语料库 建设 ,并 
先后 建成 汉语 现代 文学 作品 语料库 (1979 年 ,武汉 大 学 ,527 万 字 )、 现 代 汉语 语料库 (1983 
年 ,北京 航空 航天 大 学 ,2000 万 字 )、 中 学 语文 教材 语料库 (1983 年 ,北京 师范 大 学 ,106 万 
字 ) 和 现代 汉语 词 频 统计 语料库 (1983 年 ,北京 语言 学 院 ,182 万 字 )。 

北京 大 学 计算 语言 学 研究 所 从 1992 年 开始 现代 汉语 语料库 的 多 级 加 工 ,在 语料库 建 
设 方 面 成 绩 卓 著 , 先 后 建成 2600 万 字 的 1998 年 (人 民 日 报 ) 标 注 语料库 、2000 万 汉字 和 
1000 多 万 英语 单词 的 篇 章 级 英汉 对 照 双 语 语料库 .8000 万 字 篇 章 级 信息 科学 与 技术 领域 
的 语料库 等 。 清 华 大 学 于 1998 年 建立 了 1 亿 汉字 的 语料库 ,着重 研 究 汉语 分 词 中 的 歧义 
切 分 问题 。 

在 语言 知识 库 建设 方面 《同义词 词 林 》“ 知 网 ”(HowNet)、 概 念 层 次 网 络 
(Hierarchical Network of Concepts，HNC) 等 一 批 有 影响 的 知识 库 相 继 建成 ,并 在 自然 
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语言 处 理 研究 中 发 挥 了 积极 的 作用 。 在 上 述 诸 多 工作 中 ,北京 大 学 计算 语言 学 研究 所 开 
发 的 基于 (人民 日 报 》 语 料 标注 的 现代 汉语 分 词 和 词性 标注 语料库 、 董 振东 等 开发 的 “ 知 
网 ?是 比较 典型 的 语言 资源 成 果 。 

1. 北京 大 学 语料库 

北京 大 学 计算 语言 学 研究 所 从 1992 年 起 开始 现代 汉语 语料库 的 多 级 加 工 , 历 时 10 
余 载 ,就 取得 了 重要 成 果 。1999 年 4 月 至 2002 年 4 月 ,历时 三 年 完成 的 1998 年 全 年 (人 
民 日 报 ) 的 标注 语料库 包含 2600 多 万 汉字 ,全 部 语 料 均 已 完成 词语 切 分 和 词性 标注 等 基 
本 加 工 。 

根据 (北京 大 学 现代 汉语 语料库 基本 加 工 规范 》, 汉 语词 性 标注 包括 26 个 基本 词类 代 
码 、74 个 扩充 代码 。 标 记 集中 共有 106 个 代码 。 其 中 ,26 个 基本 词类 包括 : 名 词 (n)、 时 
间 词 (t) 、 人 处 所 词 (s) 方位 词 (D) 、 数 词 (m) 、 量 词 (q) 、 区 别 词 (b)、 代 词 (7)、 动 词 (v) 形容词 
(a) ,状态 词 (z) ,副词 (d) 、 介 词 (p)、 连 词 (c) 助词 (u) .语气 词 (y)、 叹 词 (e)、 拟 声 词 (o) 、 成 
语 (CD 、 习 用 语 (1D) \ 简 称 Gj) ` 前 接 成 分 (h)、 后 接 成 分 (k) 语素 (g) 、 非 语素 字 (x)、 标 点 符号 
Cw)。 全 部 语 料 除了 进行 词语 切 分 .词性 标注 外 ,还 对 多 音字 ( 词 ) 进 行 了 汉语 拼音 标注 。 

北京 大 学 俞 士 汶 研究 组 长 期 以 来 将 语言 知识 库 的 建设 作为 研究 重点 之 一 , 自 1995 年 
年 底 提 出 建立 “综合 型 语言 知识 库 ” 的 规划 ,研制 持续 了 10 余年 ,建立 了 现代 汉语 语法 信 
息 词典 (8 万 词 版 ) ,汉语 短语 结构 知识 库 、 中 英文 概念 词典 现代 汉语 大 规模 基本 标注 语 
料 库 、 汉 英 双 语 对 齐 语料库 、 基 于 语料库 的 双语 词典 编纂 系统 \ 信 息 提 取 系 统 ( 含 汉语 文本 
词语 切 分 与 词性 标注 软件 ) ,在 汉语 计算 语言 学 理论 .汉语 语言 知识 形式 化 描述 .语言 知识 
库 构建 技术 以 及 多 语言 知识 融合 技术 等 方面 都 有 所 创新 。 

2. 知 网 

知 网 (HowNet) 于 1999 年 正式 发 布 , 是 国内 外 知名 的 语义 资源 。 知 网 的 创建 者 董 振 
东 等 撰文 “ 知 网 的 理论 发 现 ”( 中 文 信息 学 报 ,2007) ,介绍 了 知 网 的 知识 观 、 关 于 知识 的 获 
取 和 表达 、 事 件 类 概念 分 类 的 双 轴 论 、 关 于 语义 角色 和 知识 数据 描述 语言 (KDML) 等 
内 容 。 

知 网 已 成 为 许多 自然 语言 处 理 系 统 的 基础 设施 。 知 网 把 知识 看 作 是 一 个 系统 ,是 一 
个 关于 关系 的 系统 ,包含 了 概念 与 概念 之 间 的 关系 以 及 概念 的 属性 与 属性 之 间 的 关系 的 
系统 。 知 网 表明 知识 作为 一 种 关系 的 系统 ,可 以 将 知识 结构 化 、 可 视 化 。 

知 网 通过 以 下 手段 定义 关系 : 四 通过 分 类 体系 确定 上 下 位 关系 ; @ 通 过 事件 角色 与 
典型 演员 确定 事件 与 万 物 之 间 的 关系 ; @@ 通 过 浏览 器 计算 确定 同 义 、 同 类 关系 ; 四 通过 
对 义 表 确定 反 义 关系 ; @ 通 过 公理 关系 和 角色 转换 描述 公理 推导 。 

知 网 认为 ,计算 机 对 语言 的 理解 也 需要 从 对 关系 的 分 析 入 手 。 知 网 对 于 知识 的 把 握 
从 把 握 世 界 入 手 。 知 网 目前 具有 中 英文 各 10 万 多 词汇 义 项 ,其 定义 被 7 大 类 别 所 覆盖 。 
知 网 定义 了 7 大 类 别 : 万 物 、 时 间 、 空 间 、 属 性 、 属 性 值 事 件 和 部 件 。 同 时 ,在 知识 的 描述 
方面 , 知 网 采取 了 意义 分 解 的 方法 , 即 采 用 义 原 描 述 概念 。 其 主张 是 “分 类 宜 粗 不 宜 细 , 特 
征 描述 宜 细 不 宜 粗 ”, 并 且 开 发 了 知识 数据 描述 语言 (KDML), 以 提高 意义 的 计算 能 力 。 
知 网 的 义 原 得 益 于 汉字 ,选择 了 2000 个 核心 词汇 (汉字 ) 作 为 义 原 ,并 且 要 确保 每 个 意义 
是 唯一 的 、 无 歧义 的 。 

事件 概念 分 类 的 双 轴 论 是 知 网 最 重要 的 理论 发 现 ,也 是 知 网 架构 的 支点 。 所 谓 双 轴 
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论 , 就 是 把 事件 概念 分 为 静态 和 动态 两 类 ,静态 是 一 个 轴 , 动 态 是 一 个 轴 , 分 别 标识 为 纵 轴 
和 横 轴 。 知 网 揭示 了 纵 轴 和 横 轴 的 严格 对 应 关系 , 即 纵 轴 上 有 什么 样 的 关系 和 状态 ,就 可 
以 发 现 横 轴 上 有 与 之 对 应 的 行为 动作 。 事 件 类 概念 分 类 的 双 轴 论 保证 了 分 类 标准 的 一 至 
性 和 体系 性 。 知 网 定义 了 90 个 语义 角色 ,这 些 语义 角色 与 事件 类 概念 相配 合 , 具 有 很 强 
的 概念 描述 能 力 。 

知 网 在 2000 年 推出 新 版 ,又 经 过 10 年 的 完善 ,包含 了 10 万 多 概念 及 其 相互 关系 ,并 
在 知 网 基础 上 提供 了 多 款 实用 软件 ,包括 概念 相似 度 计算 软件 .概念 相 关 场 计算 软件 、 基 
于 知 网 的 词法 处 理 器 .中 英文 双向 同义词 语 列表 软件 等 。 


8.6 信息 搜索 


网 络 搜索 引擎 是 在 Internet 上 进行 信息 查询 的 一 个 有 力 工 具 , 是 网 络 信息 检索 的 关 
键 技术 。 搜 索引 擎 对 网 络 信息 进行 分 类 .索引 和 摘要 。 早 期 搜索 引擎 的 上 述 工 作 是 靠 信 
息 发 布 者 人 工 完成 的 , 即 向 搜索 引擎 进行 登记 ,选择 主题 分 类 ,提供 关键 词 和 摘要 ,并 报告 
自己 信息 站 点 的 地 址 。 但 是 ,现在 信息 站 点 越 来 越 多 ,相当 多 的 站 点 的 信息 文档 没有 也 不 
可 能 向 搜索 引擎 登记 。 为 了 解决 这 个 问题 ,人 们 开发 了 自动 搜索 引擎 技术 。 

自动 搜索 引擎 通过 专门 设计 的 网 络 程序 自动 发 现 网 络 上 新 出 现 的 信息 ,并 对 其 进行 
自动 分 类 自动 索引 和 自动 摘要 。 自 动 搜索 引擎 还 能 为 信息 检索 者 提供 模糊 检索 、 概 念 检 
索 等 功能 ,这 些 功 能 不 是 简单 地 匹配 用 户 提供 的 检索 关键 词 , 而 是 能 够 按 它 们 的 意义 进行 
搜索 ,从 而 提高 查 全 率 和 查 准 率 。 由 于 自动 搜索 引擎 的 关键 技术 带 有 明显 的 智能 特征 , 因 
此 其 也 被 称 为 智能 搜索 引擎 。 


8.6.1 信息 搜索 概述 


信息 检索 是 指 从 文献 集合 中 查找 出 所 需 信息 的 程序 和 方法 。 所 谓 文献 集合 ,是 指 有 
组 织 的 文献 整体 。 它 可 以 是 数据 库 的 全 部 记录 ,也 可 以 是 某 种 检索 工具 清单 ,还 可 以 是 某 
个 文献 收藏 单位 收藏 的 全 部 文献 ,当然 也 可 以 是 某 个 单位 通过 Internet 发 布 的 各 类 信息 
集合 。 网 络 信息 检索 是 指 利用 Internet 信息 发 布 技术 ,对 通过 Internet 发 布 的 信息 进行 
的 检索 ,目前 主要 的 检索 手段 是 搜索 引擎 。 可 见 , 网 络 信息 检索 有 异 于 传统 的 信息 检索 ， 
为 了 区 别 和 准确 表达 概念 ,国外 越 来 越 多 的 文章 称 传统 信息 检索 概念 为 信息 检索 
(information retrieval) , 称 网 络 信息 检索 概念 为 网 络 信息 搜索 Cinformation searching) 。 

目前 ,万 维 网 (World Wide Web,WWW) 信 息 检 索 系 统 已 成 为 Internet 标准 检索 工 
具 。WWW 采用 客户 机 /服务 器 结构 ,以 其 联网 简单 (http) 、 超 链接 (hyperlinks) 、 标 准 格 
式 、 规 模 大 小 可 伸缩 、 多 媒体 浏览 界面 (browser) 等 特点 ,大 到 美国 国会 图 书馆 ,小 到 任何 
个 人 都 可 入 网 ,从 而 构成 当今 世界 上 最 大 型 .最 普及 的 网 络 信息 检索 系统 。 

通常 我 们 用 到 的 搜索 引擎 是 Internet 上 的 一 个 网 站 , 它 的 主要 任务 是 在 Internet 中 
主动 搜索 其 他 Web 站 点 中 的 信息 并 对 其 自动 索引 ,其 索引 内 容 存储 在 可 供 查 询 的 大 型 数 
据 库 中 。 当 用 户 利用 关键 字 查询 时 ,该 网 站 会 告诉 用 户 包 含 该 关键 字 信息 的 所 有 网 址 ,并 
提供 通 向 该 网 站 的 链接 。 
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搜索 引擎 是 一 种 用 于 帮助 Internet 用 户 查 询 信息 的 搜索 工具 , 它 以 一 定 的 策略 在 
Internet 中 搜集 ,发现 信息 ,对 信息 进行 理解 提取、 组 织 和 处 理 , 并 为 用 户 提供 检索 服务 ， 
从 而 起 到 信息 导航 的 目的 。 

面 对 网 络 信息 组 织 的 无 序 性 、 信 息 有 用 性 评价 难 、 网 络 信息 日 新 月 异 、 信 息 媒 体 多 样 
化 以 及 带宽 等 其 他 因素 的 制约 ,搜索 引擎 面临 如 下 挑战 。 

1. 搜索 引擎 的 用 户 交 互 方式 

“关键 词 查询 十 结果 选择 浏览 "的 交互 方式 适应 当前 的 技术 发 展 水 平 ,但 与 理想 中 自 
然 语言 问答 的 交互 形式 相距 甚 远 。 选 择 关键 词 , 以 及 从 数量 依旧 浩 繁 的 结果 中 获取 有 用 
信息 ,一 定 程度 上 还 是 需要 依靠 用 户 的 个 人 使 用 经 验 与 技巧 ,这 也 是 诸如 “谷歌 检索 指南 ” 
之 类 的 书籍 能 够 拥有 大 量 读者 的 原因 。 解 决 这 一 问题 ,传统 观点 认为 需要 包括 自然 语言 
处 理 、 多 媒体 处 理 、 信 息 检索 等 多 方面 的 技术 进步 才能 实现 ,从 深层 次 讲 , 这 甚至 涉及 “人 ” 
本 身 是 否 可 以 被 计算 的 问题 , 远 非 短 期 内 可 以 解决 。 但 是 ,搜索 引擎 推出 的 包括 问答 社区 
在 内 的 应 用 产品 则 使 用 另 一 种 方式 很 大 程度 解决 了 这 一 问题 ,并 提升 了 用 户 交互 的 友好 
性 ,如 百度 知道 .Yahoo! Answers 在 内 的 问答 社区 产品 收集 了 大 量 用 户 的 自然 语言 提问 
以 及 相应 的 回答 。 当 问答 的 数量 达到 相当 规模 时 ,大 部 分 用 户 经 常 提出 的 问题 就 可 以 在 
社区 信息 资源 中 得 到 响应 ,对 于 用 户 而 言 , 就 仿佛 搜索 引擎 能 够 通过 自然 语言 与 其 进行 问 
答 式 交 互 一 样 。 

2. 搜索 引擎 解决 问题 的 能 力 

搜索 引擎 无 疑 已 经 成 为 人 类 历史 上 最 大 规模 的 信息 集散 平台 ,但 它 仅 具备 最 初步 的 
将 这 部 分 信息 加 以 索引 和 检索 的 能 力 , 它 并 不 具备 对 于 人 类 而 言 哪怕 是 最 普通 的 知识 推 
理 能 力 。 这 决定 了 搜索 引擎 返回 给 用 户 的 只 可 能 是 现成 的 网 页 内 容 , 而 不 可 能 是 问题 直 
接 的 答案 ,更 不 可 能 是 某 些 问题 的 解决 方式 。 针 对 这 一 问题 ,传统 观点 一 般 认 为 搜索 引擎 
需要 调动 大 量 的 人 力 .物力 构建 基于 万 维 网 的 知识 库 ,并 设计 用 于 这 一 知识 库 的 推理 算 
法 ,才能 实现 使 搜索 引擎 “解决 问题 ", 而 不 是 “匹配 答案 ”"。 然 而 ,由 于 构建 知识 库 耗 费 巨 
大 ,而 相关 的 知识 工程 和 人 工 智 能 技术 发 展 也 受到 诸多 限制 ,因此 当前 主流 搜索 引擎 采用 
整合 “ 重 直 搜索 ”资源 的 方式 对 一 部 分 用 户 需 求 量 较 大 的 问题 类 别 加 以 解决 ,如 百度 的 “ 阿 
拉丁 计划 ”和 “ 框 计算 "概念 就 是 这 方面 的 典型 思路 ,针对 用 户 问 题 ,采用 与 该 问题 匹配 的 
垂直 搜索 引擎 ( 即 满足 特定 信息 需求 的 搜索 引擎 ,如 票 价 搜索 .旅游 搜索 等 ) 返 回答 案 , 而 
不 是 直接 返回 传统 意义 上 匹配 的 网 络 资源 作为 结果 。 

3. 搜索 引擎 获取 信息 的 能 力 

尽管 主流 搜索 引擎 的 数据 抓 取 能 力 十 分 强大 ,而 搜索 引擎 索引 量 达到 数 百 亿 乃 至 上 
千 亿 网 页 ,但 收集 万 维 网 尚未 涵盖 到 的 信息 对 于 搜索 引擎 而 言 也 是 “不 可 能 完成 的 任务 ”。 
即使 对 于 万 维 网 信息 资源 而 言 , 由 于 大 量 网 站 出 于 保护 用 户 隐 私 或 商业 运营 方面 的 考虑 ， 
搜索 引擎 获取 到 的 信息 也 远 达 不 到 无 所 不 有 、 无 所 不 知 的 地 步 。 针 对 这 一 问题 ,搜索 引擎 
一 方面 利用 积累 到 的 大 量 财富 调动 各 方面 资源 积极 进行 有 价值 信息 的 收集 与 整理 ,如 谷 
歌 公 司 的 谷歌 地 球 、 谷 歌 街 景 、 谷 歌 图 书 等 服务 就 是 基于 独立 收集 而 非 万 维 网 的 信息 提供 
服务 的 范例 ; 另 一 方面 ,也 基于 海量 规模 的 网 络 数据 资源 进行 深入 的 挖掘 分 析 , 提 供 更 高 
质量 的 数据 服务 ,以 提高 用 户 黏 性 ,如 百度 数据 研究 中 心 提 供 的 行业 发 展 报告 服务 .谷歌 
提供 的 “神奇 罗盘 “时 光 隧 道 " 等 服务 就 是 这 方面 的 代表 。 
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8.6.2 搜索 引擎 


大 型 Internet 搜索 引擎 的 数据 中 心 一 般 运 行 数 千 台 , 甚 至 数 十 万 台 计 算 机 ,而 且 每 天 
向 计算 机 集群 里 添加 数 十 台 机 器 ,以 保持 与 网 络 发 展 的 同步 。 搜 集 机 器 自动 搜集 网 页 信 
息 ,平均 速度 为 每 秒 数 十 个 网 页 ,检索 机 器 则 提供 容错 的 、 可 缩放 的 体系 架构 ,以 应 对 每 天 
数 千 万 ,甚至 数 亿 的 用 户 查 询 请 求 。 企 业 搜 索引 擎 可 根据 不 同 的 应 用 规模 ,从 单 台 计算 机 
到 计算 机 集群 都 可 以 进行 部 署 。 

搜索 引擎 是 用 于 在 万 维 网 上 查找 信息 的 工具 ,为 了 实现 协助 用 户 在 万 维 网 上 查找 信 
息 的 目标 ,搜索 引擎 需要 完成 收集 组织、 检索 万 维 网 信息 并 将 检索 结果 反馈 给 用 户 的 一 
系列 操作 。 

2005 年 ,意大利 Gulli 等 人 指出 表层 万 维 网 中 包含 的 网 页 数 已 经 达到 115 亿 个 以 上 。 
2008 年 ,谷歌 公司 撰文 指出 ,他 们 已 经 获知 约 1 万 亿 网 页 的 存在 。 根 据 中 国 互 联网 信息 
中 心 的 统计 ,截至 2009 年 年 底 , 中 国 网 页 数目 达到 336 亿 个 ,年 增长 率 超过 100%。 

即使 从 1991 年 加 拿 大 McGill 大 学 的 学 生 Emtage 研发 第 一 个 具有 搜索 引擎 主要 特 
征 的 软件 产品 Archie 开始 计算 ,搜索 引擎 的 发 展 也 只 经 历 了 20 多 年 的 历程 。 这 20 多 年 
内 ,我 们 见证 了 AltaVista、Lycos、Yahoo! 等 曾经 的 搜索 引擎 巨头 的 沉浮 ,也 见证 了 
Google、Baidu 的 崛起 和 独占 市 场 鳌 头 。Google. com 和 Baidu. com 分 别 成 为 全 球 和 中 国 
万 维 网 上 访问 量 最 大 的 网 站 ;Google 的 市 值 已 经 悄然 超过 Intel、IBM 等 传统 信息 产业 
巨头 。 

搜索 引擎 凭借 其 强大 的 技术 实力 和 赢利 能 力 ,已 经 成 为 用 户 访问 万 维 网 过 程 中 最 重 
要 的 和 人口, 也 已 成 为 我 们 所 处 的 这 个 信息 化 时 代 最 重要 的 基础 设施 之 一 。 

尽管 搜索 引擎 无 论 在 技术 领域 ,还 是 在 商业 层面 ,都 取得 了 巨大 的 成 功 ,但 在 当前 环 
境 下 其 依旧 面临 着 巨大 的 技术 挑战 。 搜 索引 擎 结果 页 面 中 的 结果 条 数 信息 不 断 提 醒 着 我 
们 从 海量 规模 的 信息 中 定位 所 需 是 多 么 困难 ,但 搜索 引擎 提供 给 我 们 的 依旧 不 是 我 们 提 
出 问题 的 直接 回答 ,而 往往 是 一 串 冷 冰冰 的 蓝 色 链接 。“ 关 键 词 查询 十 选择 性 浏览 ”的 交 
互 方式 是 当前 技术 发 展 水 平 下 折 中 的 选择 ,而 绝 不 是 我 们 努力 的 终点 。 为 此 ,Google 公 
司 提出 了 包括 数据 质量 评估 、 搜 索性 能 评价 、 垃 圾 网 页 识别 等 在 内 的 一 系列 搜索 引擎 技术 
挑战 ,百度 公司 在 2009 年 提出 了 * 框 计算 ”的 技术 理念 ,试图 为 今后 一 段 时 间 的 搜索 引擎 
技术 发 展 规划 方向 。 

1. 搜索 引擎 的 工作 原理 

一 般 来 说 ,完成 信息 搜索 引擎 的 任务 需要 两 个 过 程 : 其 一 是 在 服务 器 方 , 也 就 是 服务 
提供 者 对 网 络 信息 资源 进行 搜索 分 析 标 引 的 过 程 ; 其 二 是 当 用 户 方 提出 检索 需求 时 ,服务 
器 方 搜索 自己 的 信息 索引 库 , 然 后 发 送 给 用 户 的 过 程 。 前 者 可 以 称 作 信息 标 引 过 程 ,后 者 
可 以 称 作 提供 检索 过 程 。 

1) 信息 标 引 过 程 

信息 标 引 过 程 是 服务 方 对 信息 资源 进行 整理 排序 的 过 程 ,目前 主要 采用 两 种 方式 : 
一 种 是 网 络 自动 漫游 方式 ,由 计算 机 程序 自动 去 搜索 资源 ; 另 一 种 是 友情 推荐 方式 ,由 信 
息 发 布 方 或 者 用 户 将 有 用 信息 的 网 络 地 址 (URL) 填 入 搜索 清单 ,然后 再 由 机 器 程序 对 指 
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定 地 址 进行 搜索 。 

计算 机 自动 程序 定期 在 网 络 上 漫游 ,对 各 种 文档 进行 索引 分 析 , 将 结果 记录 进 数据 
库 , 人 工 也 可 以 干预 此 过 程 ,期 望 更 为 准确 地 表达 出 文档 原意 。 有 的 搜索 引擎 在 搜索 过 程 
中 使 用 自动 文摘 的 技术 生成 了 文摘 数据 库 。 

2) 提供 检索 过 程 

提供 检索 过 程 就 是 根据 用 户 检索 需求 表达 式 进行 查找 与 输出 结果 的 过 程 。 它 建立 在 
对 网 络 信息 标 引 的 索引 库 与 文摘 库 之 上 。 

用 户 通过 检索 表达 式 页 面 的 填写 反映 出 自己 的 检索 意向 ,向 系统 送 交 请 求 。 系 统 答 
复 后 ,用 户 可 以 根据 具体 情况 (包括 相关 度 、 文 摘 等 所 能 反映 出 的 状况 ) 再 决定 是 否 访问 
资源 所 在 地 。 信 息 搜索 引擎 在 整个 信息 检索 过 程 中 起 到 了 指南 和 向 导 的 作用 ,无 疑 大 大 
地 方便 了 人 们 的 检索 。 对 应 以 上 两 个 过 程 ,搜索 引擎 一 般 需 要 以 下 4 个 不 同 的 部 件 来 
完成 。 

1) 搜索 器 

搜索 器 的 主要 功能 就 是 在 互联 网 中 漫游 发 现 和 搜集 信息 。 它 常常 是 一 个 遵循 一 定 
协议 的 计算 机 程序 , 即 Robot 程序 (也 叫 作 Spider、WebCrawler)。 它 日 夜 不 停 地 运转 ， 
要 尽 可 能 多 、 尽 可 能 快 地 抓 取 网 页 搜集 各 类 信息 。 同 时 ,由 于 互联 网 上 的 信息 更 新 非常 
快 ,所 以 还 要 定期 更 新 已 经 搜集 过 的 旧 信 息 , 以 避免 死 链接 和 无 效 链接 ,保证 检索 结果 的 
质量 。 

2) 索引 器 

索引 器 的 功能 是 理解 搜索 器 所 搜索 的 信息 ,从 中 抽取 出 索引 项 ,用 于 表示 文档 以 及 生 
成 文档 的 索引 表 。 它 是 网 页 搜索 引擎 的 核心 技术 之 一 。 

不 同 的 搜索 引擎 会 采取 不 同方 式 建立 索引 ,有 的 对 整个 HTML 文件 的 所 有 单词 都 
建立 索引 ,有 的 只 分 析 HTML 文件 的 标题 或 前 几 段 内 容 , 还 有 的 能 处 理 HTML 文件 中 
的 META 标识 或 其 他 不 可 见 的 特殊 标记 。 

索引 项 可 分 为 客观 索引 项 和 内 容 索引 项 两 种 。 客 观 项 与 文档 的 语意 内 容 无 关 , 如 作 
者 名 、URL、 更 新 时 间 、 编 码 和 长 度 等 ;内 容 索 引 项 是 用 来 反映 文档 内 容 的 ,如 关键 词 及 其 
等 级 值 .短语 和 单字 等 。 内 容 索 引 项 可 以 分 为 单 索 引 项 和 多 索引 项 〈 或 称 为 短语 索引 项 ) 
两 种 。 单 索引 项 对 于 英文 来 讲 是 英语 单词 ,比较 容易 提取 ,因为 单词 之 间 有 天 然 的 分 隔 符 
空格 ;对 于 中 文 等 连续 书写 的 语言 ,必须 进行 词语 的 切 分 。 

索引 器 在 建立 索引 时 ,一 般 会 给 单 索引 项 赋予 一 个 等 级 值 ,表示 该 网 页 与 关键 词 之 间 
的 符合 程度 。 当 用 户 查询 一 个 关键 词 时 ,搜索 软件 将 找 出 所 有 与 关键 词 相符 合 的 网 页 ,有 
时 这 些 网 页 可 能 有 成 千 上 万 个 。 等 级 值 的 用 途 就 是 作为 一 种 排序 的 依据 ,搜索 软件 将 按 
照 等 级 从 高 到 低 的 顺序 把 搜索 结果 送 回 到 用 户 的 浏览 器 中 。 

3) 检索 器 

检索 器 的 主要 功能 是 根据 用 户 输入 的 关键 词 在 索引 器 形成 的 倒 排 表 中 进行 查询 , 同 
时 完成 页 面 与 查询 之 间 的 相关 度 评 价 ,对 将 要 输出 的 结果 进行 排序 ,并 实现 某 种 用 户 相 关 
性 反馈 机 制 。 

检索 器 常用 的 信息 检索 模型 有 布尔 逻辑 模型 .模糊 逻辑 模型 .向 量 空间 模型 及 概率 模 
型 等 。 各 种 不 同 检 索 模型 使 用 的 方法 不 同 ,但 要 达到 的 目标 是 相同 的 , 即 按照 用 户 要 求 ， 
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提供 用 户 所 需 的 信息 。 实 际 上 ,大 多 数 检索 系统 往往 将 上 述 各 种 模型 混合 在 一 起 ,以 达到 
最 佳 的 检索 效果 。 

4) 用 户 接口 

用 户 接口 的 作用 是 输入 用 户 查 询 、 显 示 查 询 结果 、 提 供用 户 相关 性 反馈 机 制 。 

搜索 引擎 系统 由 数据 抓 取 子 系统 内容 索引 子 系统 、 链 接 结构 分 析 子 系统 和 信息 查询 
子 系统 4 个 部 分 组 成 ,如 图 8-7 所 示 。 
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图 8-7 搜索 引擎 系统 架构 示意 图 


从 具体 运行 方式 上 说 ,系统 根据 站 点 /网 页 的 URL 信息 和 网 页 之 间 的 链接 关系 , 利 
用 网 络 蜂 蛛 在 互联 网 上 收集 数据 ;收集 的 数据 分 别 通过 链接 信息 分 析 器 和 文本 信息 分 析 
器 处 理 , 保 存在 链接 结构 信息 库 和 文本 索引 信息 库 中 ,同时 ,网 页 质量 评估 模块 依据 网 页 
的 链接 关系 和 页 面 结构 特征 对 页 面 质量 进行 评估 ,并 将 评估 的 结果 保存 在 索引 信息 库 中 ; 
查询 服务 器 负责 与 用 户 的 交互 , 它 根据 用 户 的 检索 需求 ,从 索引 信息 库 中 读 取 对 应 的 索 
引 , 并 综合 考虑 查询 相关 性 与 页 面 质量 评估 结果 之 间 的 关系 ,给 出 查询 结果 列表 反馈 给 
用 户 。 

为 了 满足 用 户 对 各 种 信息 形式 的 搜索 需求 ,搜索 引擎 提供 的 常用 服务 有 网 页 搜索 .图 
像 搜索 .MP3 搜索 和 视频 搜索 等 。 其 中 ,网 页 搜索 是 最 基本 、 最 常用 的 搜索 引擎 服务 。 由 
于 网 页 /网 站 的 内 容 有 许多 不 同类 型 ,用 户 对 新 闻 、 黄 页 ,博客 等 类 型 的 信息 有 特殊 的 搜索 
需求 ,搜索 引擎 也 提供 了 新 闻 搜 索 、 黄 页 搜索 、 本 地 生活 搜索 和 博客 搜索 等 专门 服务 。 搜 
索引 擎 服务 商 不 仅 提供 针对 计算 机 用 户 的 搜索 服务 ,也 推出 移动 搜索 等 专门 服务 ,支持 来 
自 手 机 等 多 种 移动 设备 的 搜索 请 求 。 另 外 ,针对 个 人 计算 机 用 户 对 自己 计算 机 内 所 存储 
文档 的 查询 需求 ,搜索 引擎 公司 也 推出 硬盘 搜索 、 桌 面 搜索 这 样 的 客户 端 软件 产品 。 总 
之 ,由 于 信息 形式 内 容 的 多 样 性 和 用 户 搜索 需求 的 多 样 性 ,会 衍生 出 各 种 各 样 的 专门 搜索 
引擎 。 

从 用 户 在 搜索 框 输入 查询 ,到 搜索 引擎 返回 搜索 结果 ,所 需 时 间 仅 是 亚 秒 级 。 看 似 简 
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单 , 背 后 过 程 却 很 复杂 ,提供 这 一 服务 的 是 庞大 的 计算 机 集群 。 这 还 只 是 实时 线 上 检索 部 
分 。 为 了 完成 线 上 的 搜索 服务 , 线 下 还 有 对 检索 库 的 抓 取 、 处 理 和 建 索引 工作 。 在 这 亚 秒 
级 时 间 里 ,为 了 得 到 搜索 结果 ,实际 上 有 成 百 上 千 的 处 理 器 ,在 上 百 个 万 亿 字 节 
(terabytes) 的 索引 库 上 参与 工作 。 由 大 量 低 价 .异型 PC 组 成 的 计算 机 群 ,依靠 
MapReduce/ Hadoop 这 样 的 软件 系统 ,可 以 成 为 高 性 能 、 高 容错 的 海量 数据 存储 和 处 理 
系统 ,圆满 完成 信息 检索 、 文 本 挖掘 、 数 据 分 析 等 复杂 作业 。 

就 技术 层面 而 言 ,搜索 引擎 是 一 个 综合 性 的 计算 机 技术 应 用 工程 。 一 个 互联 网 搜索 
引擎 系统 主要 由 网 页 抓 取 、 网 页 内 容 分 析 和 索引 、 相 关 性 分 析 和 检索 服务 4 个 子 系统 组 
成 。 搜 索引 擎 中 发 展 的 核心 技术 涉及 计算 机 科学 技术 的 许多 前 沿 领 域 ,如 信息 检索 、 高 性 
能 分 布 式 网 络 计算 ,数据 挖掘 ,自然 语言 处 理 和 人 机 界面 。 对 搜索 引擎 技术 的 研究 ,近年 
来 在 工业 界 和 学 术 界 也 十 分 活路 ,热门 研究 课题 包括 网 页 抓 取 、 内 容 索 引 、 查 询 检 索 、 超 链 
分 析 、 相 关 性 评估 、 作 整 网 页 识别 、 网 页 文本 挖掘 ,用户 搜索 行为 分 析 和 挖掘 ,信息 检索 中 
的 语言 模型 ,命名 实体 识别 和 社会 网 络 分 析 等 。 

2. 搜索 模型 

信息 搜索 模型 被 认为 是 信息 搜索 系统 的 核心 , 它 为 搜索 系统 的 信息 的 有 效 获取 提供 
了 重要 的 理论 支持 。 目 前 ,文本 信息 搜索 的 方法 有 : 基于 关键 字 匹配 的 检索 方法 .基于 主 
题 的 搜索 引擎 .启发 式 的 智能 搜索 方法 等 。 研 究 与 开发 文本 信息 搜索 的 技术 重点 是 自动 
分 词 技术 .自动 摘要 技术 、 信 息 的 自动 过 滤 技 术 .自然 语言 的 理解 识别 技术 。 下 面 介绍 全 
文 搜索 模型 和 基于 内 容 的 搜索 模型 。 

1) 全 文 搜索 模型 

全 文 搜索 模型 是 以 文档 全 部 文本 信息 作为 搜索 对 象 的 信息 搜索 技术 ,其 关键 是 文档 
的 索引 , 即 如 何 将 原文 档 中 所 有 的 基本 元 素 信息 以 适当 形式 记录 到 索引 库 中 。 全 文 搜索 
分 为 字 表 法 和 词 表 法 两 种 形式 。 

(1) 字 表 法 : 字 表 法 是 根据 每 个 字 出 现 的 位 置 进行 搜索 的 方法 , 即 扫描 整个 源 文 档 ， 
将 每 个 有 效 字 〈 符 ) 在 文档 中 出 现 的 位 置 记 录 到 索引 库 中 ,索引 库 对 每 个 不 同 的 字 都 保存 
一 字 表 。 

(2) 词 表 法 : 与 字 表 法 相似 , 词 表 法 是 以 能 表达 一 定 意 义 的 词 为 基本 检索 单位 ,并 根 
据 词 的 出 现 位置 进 行 索引 和 检索 的 文本 检索 方法 。 建 立 索 引 时 ,首先 需要 对 源 文档 进行 
词 条 的 切 分 ,然后 对 切 分 后 的 文档 词 条 进行 统计 .记录 每 一 个 出 现 的 词 条 及 其 出 现 的 
位 置 。 

字 表 法 和 词 表 法 各 有 优 缺 点 ,有 各 自 适用 的 场合 和 处 理 的 对 象 。 

2) 基于 内 容 的 搜索 模型 

基于 内 容 的 搜索 模型 是 根据 文档 的 语义 和 上 下 文 之 间 的 联系 进行 搜索 ,其 特点 是 从 
文档 内 容 中 提取 信息 特征 ,建立 特征 矢量 作为 索引 进行 搜索 。 该 搜索 模型 的 特点 是 生成 
的 索引 库 小 ,索引 库 长 度 通常 是 源 文档 的 几 十 分 之 一 或 几 百 分 之 一 ,搜索 速度 快 , 较 接 近 
人 的 查询 习惯 。 其 中 使 用 较 多 的 是 布尔 搜索 模型 .向 量 空 间 模型 与 概率 模型 。 

(1) 布尔 搜索 模型 。 

布尔 搜索 模型 又 称 严格 匹配 模型 。 用 一 个 二 值 变 量 集合 表示 文档 D, 写 为 DCd ,…， 
d,) ,其 中 d; 由 文档 集中 的 词 条 组 成 ,对 应 于 文档 特征 项 ,车 词 条 对 文档 内 容 有 作用 , 则 为 
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1, 和 否则 为 0。 搜索 时 ,根据 用 户 的 搜索 条 件 Q(Cqo: ,… ,gq, ) 是 否 满足 文档 D(d ,…,d,) 中 的 
逻辑 关系 将 搜索 文档 分 为 匹配 集 和 非 匹配 集 。 

(2) 向 量 空间 模型 。 

向 量 空 间 模型 是 目前 应 用 较 多 、 效 果 较 好 的 搜索 模型 之 一 。 此 模型 将 文档 看 作 是 由 
相互 独立 的 词 条 组 (T,,…,T, ) 构 成 ,对 于 每 一 词 条 Ti ,根据 其 在 文档 中 的 重要 程度 赋 以 
一 定 的 权 值 W;, 并 将 TT ,… ,7T, 看 成 一 个 n 维 坐 标 系 中 的 坐标 轴 , 由 (TT,…,T, ) 分 解 而 
得 的 正 交 词 条 矢量 组 构成 了 一 个 文档 向 量 空 间 , 文 档 则 映射 成 为 空间 中 的 一 个 点 。 所 有 
文档 和 用 户 搜 索 都 可 映射 到 此 文本 向 量 空间 中 ,用 词 条 矢量 (Ti ,Wi,…,7T,,W,) 表 示 ， 
从 而 将 文档 信息 的 匹配 问题 转化 为 向 量 空间 矢量 匹配 问题 。 假 设 用 户 查 询 为 Q, 被 搜索 
的 文档 为 D, 两 者 的 相似 程度 可 用 向 量 之 间 的 夹 角 0 度量 , 夹 角 越 小 说 明 相似 程度 越 高 。 

(3) 概率 模型 。 

布尔 模型 和 向 量 空间 模型 都 是 将 词 条 看 成 是 相互 独立 的 项 ,忽略 了 词 条 间 的 关联 性 
和 相关 性 。 概 率 模型 则 弥补 了 这 一 点 , 它 充分 利用 词 条 间 以 及 词 条 与 文档 间 的 概率 相依 
性 。 二 值 独立 搜索 模型 就 是 一 种 实现 简单 且 效 果 较 好 的 概率 模型 。 模 型 假设 文档 D 和 
用 户 搜索 Q 都 可 用 二 值 词 条 向 量 表示 (zi ,… ,zx,) ,如 果 词 条 T; ED, 则 zx; 二 1, 否 则 
Xi=O。 

以 上 3 种 模型 中 ,布尔 多 辑 模型 是 最 简单 .基础 的 模型 ,用 户 以 检索 项 在 文档 中 的 布 
尔 逻辑 关系 提交 查询 。 查 询 结 果 一 般 不 进行 相关 性 排序 。 为 了 避免 这 种 不 足 , 在 查询 结 
果 处 理 中 往往 引进 了 模糊 逻辑 运算 。 

与 布尔 多 辑 模型 不 同 ,向量 空间 模型 以 检索 项 的 向 量 空间 表示 用 户 的 查询 要 求 和 数 
据 库 文档 信息 。 根 据 向 量 空间 的 相似 性 ,排列 查询 结果 ,向 量 空间 模型 不 仅 可 方便 地 产生 
有 效 的 查询 结果 ,而且 能 提供 相关 文档 的 文摘 ,并 进行 查询 结果 分 类 ,为 用 户 提供 准确 定 
位 所 需 的 信息 。 基 于 贝 叶 斯 概率 论 原理 的 概率 模型 不 同 于 布尔 和 向 量 空间 模型 , 它 利 用 
相关 反馈 的 归纳 学 习 方法 ,获取 匹配 函数 。 

3. 搜索 引擎 的 分 类 

1) 一 般 搜 索引 擎 

这 种 搜索 引擎 也 是 一 般 网 民 经 常 在 网 络 上 用 到 的 搜索 工具 ,通常 分 为 以 下 3 类 。 

(1) 基于 Robot 的 搜索 引擎 。 这 种 搜索 引擎 的 特点 是 利用 一 个 称 为 Robot 的 程序 自 
动 访问 Web 站 点 ,提取 站 点 上 的 网 页 ,并 根据 网 页 中 的 链接 进一步 提取 其 他 网 页 ,或 转移 
到 其 他 站 点 上 。Robot 搜集 的 网 页 被 加 入 到 数据 库 中 ,供用 户 查 询 使 用 。 

(2) 分 类 目录 。 分 类 目录 (如 Yahoo) 与 基于 Robot 的 搜索 引擎 不 同 的 是 ,分 类 目 
录 的 数据 库 是 依靠 专职 编辑 或 志愿 人 员 建 立 起 来 的 ,这 些 编辑 人 员 在 访问 了 某 个 Web 
站 点 后 撰写 一 段 对 该 站 点 的 描述 ,并 根据 站 点 的 内 容 和 性质 将 其 归 为 一 个 预先 分 好 的 
类 别 ,把 站 点 的 URL 和 描述 放 在 这 个 类 别 中 , 当 用 户 查 询 某 个 关键 词 时 ,搜索 软件 只 
在 这 些 描述 中 进行 搜索 。 很 多 目录 也 接受 用 户 提交 的 网 站 和 描述 , 当 目录 的 编辑 人 员 
认可 该 网 站 及 描述 后 ,就 会 将 之 添加 到 合适 的 类 别 中 。 人 们 搜索 时 就 按 相 应 类 别 的 目 
录 查 询 下 去 。 

这 类 引擎 往往 还 伴 有 网 站 查询 功能 ,也 称 之 为 网 站 检索 , 即 提供 一 个 文字 输入 框 和 一 
个 按钮 。 我 们 可 以 在 文字 框 中 输入 要 查找 的 字 、 词 或 短语 ,再 单 击 按钮 , 便 会 在 目录 中 查 
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找 相 关 的 站 名 、 网 址 和 内 容 提 要 ,将 查 到 的 内 容 列 表 送 过 来 。 

(3) 两 者 相 结合 的 搜索 引擎 。 某 些 搜 索引 擎 既 提 供 基 于 Robot 的 搜索 方法 ,也 提供 
分 类 目录 。 这 种 包含 在 基于 Robot 的 搜索 引擎 中 的 目录 通常 质量 比较 高 ,用 户 可 以 从 那 
里 找到 很 多 有 用 的 网 站 。 这 种 搜索 引擎 结合 了 上 述 两 种 优点 ,使 用 户 使 用 起 来 更 加 方便 。 
目前 国内 的 很 多 站 点 提供 的 就 是 这 种 搜索 引擎 。 

2) 元 搜索 引擎 

元 搜索 引擎 是 对 分 布 于 网 络 的 多 种 检索 工具 的 全 局 控制 机 制 , 它 通过 一 个 统一 用 户 
界面 帮助 用 户 在 多 个 搜索 引擎 中 选择 和 利用 合适 的 (甚至 是 同时 利用 若干 个 ) 搜 索引 擎 实 
现 检索 操作 。 

可 将 元 搜索 引擎 看 成 具有 双 层 C/S 结构 的 系统 ,用 户 向 元 搜索 引擎 发 出 检索 请 求 ， 
元 搜索 引擎 再 根据 该 请 求 向 多 个 搜索 引擎 发 出 实际 检索 请 求 ,搜索 引擎 执行 元 搜索 引擎 
检索 请 求 后 将 检查 结果 以 应 答 形式 传送 给 元 搜索 引擎 ,元 搜索 引擎 将 从 多 个 搜索 引擎 获 
得 的 检索 结果 经 过 整理 再 以 应 答 形式 传送 给 实际 用 户 。 

3) 专用 搜索 引擎 

专题 性 搜索 引擎 搜索 结果 更 精确 .相关 性 更 高 , 它 不 求 包罗 各 个 学 科 , 但 求 本 专业 \ 本 
学 科 最 全 ,其 服务 对 象 是 专业 人 员 与 研究 人 员 。 

搜索 引擎 的 其 他 分 类 方法 还 有 : 按照 自动 化 程度 分 为 人 工 与 自动 引擎 ;按照 是 否 具 
有 智能 功能 分 为 智能 与 非 智 能 引擎 ;按照 搜索 内 容 分 为 文本 搜索 引擎 .语音 搜索 引擎 .图 
形 搜索 引擎 .视频 搜索 引擎 等 。 

经 过 多 年 的 发 展 之 后 ,搜索 引擎 已 经 取得 了 非常 令 人 瞩目 的 成 就 。 现 在 的 搜索 引擎 
功能 越 来 越 强大 ,提供 的 服务 也 越 来 越 全 面 ,它们 的 目标 是 把 自己 发 展 成 为 用 户 首选 的 
Internet 入 口 站 点 ,而 不 仅仅 是 提供 单纯 的 查询 功能 。 但 随 着 网 上 信息 数量 、 种 类 的 不 断 
增加 ,服务 需求 水 平 的 不 断 提高 ,用 户 对 搜索 引擎 也 提出 了 更 高 的 要 求 ,搜索 引擎 面临 着 
巨大 的 挑战 。 

搜索 引擎 的 现状 是 : 四 各 种 搜索 引擎 走向 不 断 融 合 ; @ 多 样 化 和 个 性 化 的 服务 ; 
加 强大 的 查询 功能 ; 四 本 地 化 。 


8.6.3 智能 搜索 引擎 


为 了 应 付 搜索 引擎 面临 的 种 种 挑战 ,未 来 的 搜索 引擎 发 展 方向 就 是 采用 基于 人 工 智 
能 技术 的 Agent 技术 ,利用 智能 Agent 的 强大 功能 实现 网 络 搜索 的 系统 化 、 高 效 化 、 全 面 
化 .精确 化 和 完整 化 ,并 实现 智能 分 析 和 评估 检测 的 能 力 ,以 满足 网 络 用户 不 断 发 展 的 

1. 智能 搜索 引擎 特征 

智能 搜索 引擎 是 结合 人 工 智 能 技术 的 新 一 代 搜索 引擎 。 由 于 它 将 信息 检索 从 目前 基 
于 关键 词 层面 提高 到 基于 知识 (概念) 层面 ,对 知识 有 一 定 的 理解 与 处 理 能 力 ,能 够 实现 
分 词 技 术 、 同 义 词 技 术 、 概 念 搜索 、 短 语 识别 以 及 机 器 翻译 技术 等 。 智 能 搜索 引擎 具有 信 
息 服务 的 智能 化 、 人 性 化 特征 ,允许 网 民 采 用 自然 语言 进行 信息 的 检索 ,为 他 们 提供 更 方 
使 .更 确切 的 搜索 服务 。 具 体 地 讲 , 可 归纳 为 以 下 3 方面 特征 。 
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1) Robot 技术 向 分 布 式 ,智能 化 方向 发 展 

如 前 所 述 ,Robot 技术 大 大 降低 了 人 工 搜集 信息 的 难度 ,但 它 的 盲目 性 也 给 网 络 带 来 
了 麻烦 。 随 着 分 布 式 处 理 技 术 的 发 展 ,Robot 技术 也 正在 由 集中 式 向 分 布 式 发 展 , 即 一 个 
Robot 只 对 特定 区 域 进行 信息 采集 .各 个 Robot 之 间 协 同 工 作 ,这 样 就 大 大 提高 了 Robot 
进行 信息 采集 的 速度 。 基 于 Web 的 文本 信息 挖掘 技术 通过 对 Robot 采集 的 信息 的 处 理 ， 
如 站 点 摘要 处 理 . 站 点 更 新 速度 处 理 等 ,可 以 对 Robot 的 路 径 选 择 .运行 周期 等 加 以 控 
制 ,从 而 降低 Robot 的 盲目 性 ,大 大 提高 Robot 的 智能 性 。 

此 外 ,智能 搜索 引擎 具有 跨 平台 工作 和 处 理 多 种 混合 文档 结构 的 能 力 。 壁 如, 既 能 处 
理 超 文 本 标志 语言 (Hyper Text Markup Language, HTML), 又 能 处 理 通用 标志 语言 
(Standard for General Markup Language, SGML) 和 扩展 标志 语言 (eXtended Markup 
Language,XML) 文 档 以 及 其 他 类 型 的 文档 ,如 Word、WPS 等 。 

同时 ,智能 搜索 引擎 还 具有 高 的 召回 率 和 准确 率 。 所 谓 召 回 率 ,是 指 一 次 搜索 结果 集 
中 符合 用 户 要 求 的 数目 与 用 户 查 询 相关 的 总 数 之 比 。 所 谓 准 确 率 , 是 指 一 次 搜索 结果 集 
中 符合 用 户 要 求 的 数目 与 该 次 搜索 结果 总 数 之 比 。 

最 后 ,智能 搜索 引擎 应 该 可 以 支持 多 语言 搜索 ,允许 用 户 可 以 用 中 文 输入 查询 英文 或 
其 他 语言 的 信息 。 

2) 人 机 接口 的 智能 化 

人 机 接口 的 智能 化 主要 通过 提供 更 好 的 人 机 交互 界面 技术 和 关联 式 的 综合 搜索 两 方 
面体 现 。 

(1) 人 机 交互 界面 技术 。 

人 机 交互 界面 技术 的 不 同 往往 使 得 搜索 引擎 表现 出 不 同 的 特色 。 当 前 搜索 引擎 涉及 
的 人 机 界面 技术 主要 有 四 类 : 搜索 请 求 提交 技术 .搜索 结果 表现 技术 .搜索 向 导 技 术 、 搜 
索 行 为 分 析 技 术 。 

搜索 请 求 提 交 技 术 中 有 几 个 很 有 用 的 技术 ,包括 多 语言 查询 技术 、 编 码 转换 技术 、 模 
糊 语义 查询 、 精 确 语 义 查询 以 及 采用 自然 语言 的 搜索 请 求 提交 界面 。 搜 索 结果 表现 技术 
包括 搜索 结果 的 准确 度 及 相关 度 .搜索 结果 的 母语 评价 等 。 搜 索 向 导 技 术 则 纯粹 是 网 站 
设计 上 的 界面 技术 。 它 通过 具有 亲和力 、 易 用 的 界面 ,即时 的 帮助 方便 网 民 的 搜索 。 搜 索 
行为 分 析 技 术 的 核心 是 跟踪 、 分 析 用 户 的 搜索 行为 ,充分 利用 这 些 信 息 提 高 用 户 的 搜索 效 
率 。 搜 索 行 为 分 析 技 术 提高 搜索 效率 的 途径 主要 有 两 种 : 群体 行为 分 析 和 个 性 化 搜索 。 

(2) 关联 式 的 综合 搜索 。 

以 往 的 搜索 大 都 是 在 甲 网 站 找 图 片 ,到 乙 网 站 找 新 闻 ,到 丙 网 站 找 股票 资讯 。 这 种 方 
式 十 分 麻烦 ,而 且 浪费 时 间 。 那 为 何不 将 图 片 . 新 闻 、 股 票 等 各 种 有 关联 的 信息 整合 在 同 
一 界面 呢 ? 关联 式 综合 搜索 就 是 这 样 一 种 一 站 式 的 搜索 服务 , 它 使 得 网 民 搜 索 时 只 输入 
一 次 查询 目标 , 即 可 在 同一 界面 得 到 各 种 有 关联 的 查询 结果 。 这 项 服务 的 关键 在 于 有 一 
个 构建 在 XML 基础 上 的 整合 资讯 平台 。 

3) 更 精确 的 搜索 

要 想 大 幅度 地 提高 搜索 引擎 的 效率 和 搜索 结果 的 准确 度 ,应 考虑 如 下 几 个 方向 。 

(1) 智能 化 搜索 。 准 确 地 搜索 应 建立 在 对 收集 信息 和 搜索 请 求 的 理解 之 上 。 也 就 是 
说 ,必须 处 理 语义 信息 。 显 然 , 基 于 自然 语言 理解 技术 的 搜索 引擎 ,由 于 可 以 同 用 户 使 用 
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自然 语言 交谈 ,并 深刻 理解 用 户 的 搜索 请 求 , 因 此 查询 的 结果 也 更 加 准确 。 

(2) 个 性 化 搜索 。 也 就 是 将 搜索 建立 在 个 性 化 的 搜索 环境 下 ,通过 对 用 户 的 不 断 了 
解 、 分 析 , 使 得 个 性 化 搜索 更 符合 每 个 用 户 的 需求 ,而 不 仅仅 是 准确 。 

(3) 结构 化 搜索 。 指 充分 利用 XML 等 技术 使 信息 结构 化 ,同时 使 查询 结构 化 ,从 而 
使 搜索 的 准确 度 大 大 提高 。 

(4) 垂直 化 专业 领域 搜索 。 由 于 社会 分 工 的 加 大 ,网 民 从 事 的 职业 有 很 大 不 同 , 不 同 
网 民 对 信息 搜索 也 往往 有 自己 的 专业 要 求 。 例 如 ,信息 技术 类 从 业 人 员 最 希望 有 面向 信 
息 技 术 的 专业 搜索 引擎 ,金融 证 券 从 业 人 员 则 希望 使 用 金融 证 券 类 的 搜索 引擎 。 

(5) 本 土 化 的 搜索 。 各 国 的 文化 传统 、 思 维 方 式 和 生活 习惯 不 同 , 在 对 网 站 内 容 的 搜 
索要 求 上 也 就 存在 差异 。 搜 索 结 果 要 符合 当地 用 户 的 要 求 , 搜 索引 擎 就 必须 本 土 化 。 

2. 智能 搜索 引擎 技术 

要 想 真 正 实现 如 上 所 述 的 智能 搜索 引擎 ,还 有 大 量 的 工作 要 做 。 一 种 比较 实际 的 做 
法 是 将 智能 技术 与 传统 搜索 引擎 结合 ,逐步 实现 智能 化 。 下 面 介 绍 在 搜索 技术 中 应 用 的 
几 种 新 兴 技 术 。 

1) 自然 语言 理解 技术 

自然 语言 理解 是 计算 机 科学 中 一 个 引人入胜 、 富 有 挑战 性 的 课题 。 从 计算 机 科学 , 特 
别 是 从 人 工 智能 的 观点 看 ,自然 语言 理解 的 任务 是 建立 一 种 计算 机 模型 ,这 种 计算 机 模型 
能 够 给 出 像 人 那样 理解 、 分 析 并 回答 自然 语言 ( 即 人 们 日 常 使 用 的 各 种 通俗 语言 ) 的 

目前 ,基于 自然 语言 理解 的 智能 搜索 引擎 的 研发 主要 有 两 大 方向 : 其 一 是 基于 机 器 
翻译 技术 , 它 是 利用 计算 机 把 一 种 自然 语言 转变 成 另 一 种 自然 语言 的 过 程 。 这 一 技术 的 
研究 成 果 将 使 得 用 户 可 以 使 用 母语 搜索 非 母 语 的 网 页 ,并 以 母语 浏览 搜索 结果 。 目 前 ， 
Google 就 是 往 这 方面 发 展 ,并 已 经 取得 一 些 成 果 ; 其 二 是 基于 语义 理解 技术 ,语义 理解 通 
过 将 语言 学 的 研究 成 果 和 搜索 引擎 技术 结合 在 一 起 ,实现 了 搜索 引擎 对 搜索 词 在 语义 层 
次 上 的 理解 ,为 用 户 提 供 最 确切 的 搜索 服务 。 目 前 这 一 技术 的 拥护 者 有 国内 的 尤 里 卡 、 问 
一 问 , 国 外 的 Ask Jeeves 等 。 

自然 语言 理解 包括 自动 分 词 技 术 、 概 念 搜索 .短语 识别 .同义词 技术 及 自动 文摘 生成 ， 
下 面 就 这 些 具体 的 技术 展开 一 些 讨 论 。“ 自 动 文摘 生成 技术 ”参见 8. 10. 2 节 。 

(1) 自动 分 词 技 术 。 

关键 词 查询 的 前 提 是 将 查询 条 件 分 解 成 若干 关键 词 , 同 时 一 些 关 键 词 表示 文档 。 对 
英文 而 言 ,一 个 单词 就 是 一 个 词 。 中 文 词 与 词 之 间 没 有 界定 符 , 需 要 人 为 切 分 。 汉 语 中 存 
在 大 量 的 歧义 现象 ,对 几 个 字 分 词 可 能 有 好 多 种 结果 。 

目前 的 分 词 方法 很 多 ,常用 的 有 正 向 最 大 匹配 法 、 逆 向 最 大 匹配 法 ,最 佳 匹配 法 、 逐 词 
遍历 法 .抽取 中 频 字 串 法 ,此 外 还 有 邻接 约束 法 、 最 少 分 词法 等 。 归 纳 起 来 不 外 乎 两 类 : 
一 类 是 理解 式 切 词法 , 即 利用 汉语 的 语法 知识 和 语义 知识 以 及 心理 学 知识 进行 分 词 ,需要 
建立 分 词 数据 库 .知识 库 和 推理 机 ; 另 一 类 是 机 械 式 分 词法 ,一般 以 分 词 词 则 为 依据 ,通过 
文档 中 的 汉字 串 和 词 表 中 的 词 逐一 匹配 完成 词 的 切 分 。 相 比 而 言 , 第 一 类 分 词 方案 的 算 
法 复杂 度 高 ,还 处 于 研究 阶段 。 第 二 类 分 词 方法 实现 简单 , 比 起 第 一 类 较 具体 、 实 用 ,而 且 
也 可 以 达到 较 高 的 准确 度 。 为 了 提高 系统 分 词 的 准确 度 ,可 采用 正 向 最 大 匹配 法 和 逆向 
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最 大 匹配 法 相 结合 的 分 词 方案 。 先 根据 标点 对 文档 进行 粗 切 分 ,把 文档 分 解 成 若干 个 句 
子 , 然 后 再 对 这 些 句 子 用 正 向 最 大 匹配 法 和 逆向 最 大 匹配 法 进行 扫描 切 分 。 如 果 两 种 分 
词 方法 得 到 的 匹配 结果 相同 , 则 认为 分 词 正确 ,否则 按 最 小 集 处 理 。 另 外 , 当 匹 配 出 现 歧 
义 时 ,也 可 采用 马尔 科 夫 语言 模型 进行 处 理 。 

(2) 概念 搜索 。 

在 很 多 情况 下 ,用户 很 难 简单 用 关键 词 或 关键 词 串 真 实地 表达 真正 需要 检索 的 内 容 。 
另外 ,对 同一 概念 的 检索 ,不 同 的 用 户 可 能 使 用 不 同 的 关键 词 查询 。 这 两 方面 原因 造成 的 
直接 后 果 就 是 返回 大 量 的 无 关 信息 。 例 如 ,“ 计 算 机 ”和 “电脑 ”是 同一 类 概念 ,但 应 用 传统 
搜索 引擎 检索 的 结果 往往 大 不 相同 。 智 能 搜索 引擎 把 信息 检索 从 目前 基于 关键 词 层面 提 
高 到 基于 知识 (概念 ) 层 面 , 从 概念 意义 层次 上 认识 和 处 理 检索 用 户 的 请 求 。 

概念 是 关于 具有 共同 属性 的 一 组 对 象 .事件 或 符号 的 知识 。 它 可 能 是 具体 的 ,也 可 能 
是 抽象 地 刻画 、 定 义 了 一 对 象 类 的 特征 ,通过 描述 元 素 表达 出 来 。 同 一 概念 可 以 用 多 个 抽 
象 元 素 表达 ,这 些 描 述 元 素 在 此 概念 的 约 东 下 构成 了 同 义 关系 ,它们 在 此 意义 上 可 以 等 
同 。 概 念 检索 就 是 在 检索 时 将 这 些 描述 元 素 自动 归并 为 同一 概念 ,因而 不 仅 能 检索 出 包 
含 这 个 具体 词汇 的 结果 ,还 能 检索 出 包含 与 该 词 同属 一 类 概念 的 词汇 的 结果 。 

另外 ,概念 并 不 是 孤立 存在 的 ,一 个 概念 总 是 与 其 他 概念 之 间 存 在 着 各 种 各 样 的 关 
系 , 根 据 概念 之 间 的 相互 联系 ,在 词 的 概念 含义 层次 上 建立 联系 ,为 检索 用 户 提供 相关 的 
结果 分 析 是 概念 检索 的 另 一 个 应 用 前 景 。 基 于 概念 的 检索 就 是 利用 了 词 条 在 概念 上 的 相 
关 性 ,检索 出 那些 并 不 显 式 地 包含 用 户 指定 的 词 条 , 却 包含 其 同义词 或 下 位 词 的 文档 。 

基于 概念 的 智能 搜索 引擎 需要 具备 符合 用 户 实际 需要 的 知识 库 ,在 搜索 时 ,引擎 根据 
已 有 的 知识 库 了 解 检索 词 的 意义 并 以 此 产生 联想 ,从 而 找 全 相关 文章 。 适 当 的 知识 表示 
是 建立 知识 库 系统 的 关键 ,语义 网 络 是 其 中 一 种 常用 的 表示 方法 。 

概念 语义 网 络 是 一 个 带 标识 的 有 向 图 ,其 中 , 结 点 表示 概念 ,有 向 边 表示 概念 之 间 的 
联系 ,指明 所 联结 的 概念 结 点 之 间 的 某 种 关系 。 实 心 点 表示 主题 词 概念 结 点 ) ,空心 点 
表示 非 主题 词 。 

概念 具有 层次 结构 ,不同 的 层次 表明 其 抽象 的 程度 不 同 , 层 次 越 高 ,概括 性 越 强 ,包含 
的 下 位 概念 可 能 越 多 。 上 位 概念 由 一 组 下 位 概念 组 成 ,上 位 概念 常常 是 下 位 概念 的 抽象 、 
概括 或 整体 表示 ;下 位 概念 往往 是 上 位 概念 的 属性 、 特 征 或 说 明 , 是 对 上 位 概念 的 补充 和 
细 化 , 它 描述 自己 的 独 有 属性 ,同时 继承 上 位 概念 的 属性 。 从 这 个 意义 上 看 ,概念 语义 网 
络 首先 是 一 个 分 类 树 。 根 据 计 算 机 领域 的 特点 和 通常 的 分 类 标准 ,概念 语义 网 络 共 分 为 
4 层 。 第 1 层 是 最 高 层 ,是 最 具 概 括 性 的 概念 ,表明 了 一 个 独立 的 主题 ,以 下 各 层 逐 步 细 
化 。 例 如 ,“ 计 算 机 ”可 分 为 “软件 ”和 “硬件 "等 。 

除了 层次 关系 之 外 ,概念 之 间 又 具有 各 种 联系 。 为 了 表示 概念 之 间 的 相互 关系 ,在 树 
形 结构 的 基础 上 添加 横向 关系 ,把 各 个 独立 的 概念 联系 起 来 ,如 “计算 机 ”和 “电脑 "为 同 义 
关系 。 这 些 横 向 关系 联结 的 概念 结 点 可 以 是 任意 层 上 的 任意 结 点 ,从 而 构成 一 个 语义 
网 络 。 

(3) 短语 识别 。 

用 短语 描述 查询 请 求 的 情况 很 常见 。 壁 如 ,查询 条 件 “ 北 京 的 气温 “北京 "和 “气温 ” 
存在 一 定 的 关系 ,但 如 果 不 将 “北京 "和 “气温 ”联合 起 来 作为 一 个 短语 查询 ,那么 ,除了 选 
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出 关于 “北京 的 气温 ”的 文档 之 外 ,还 将 查 出 有 关 “ 北 京 "? 和 “气温 ”的 文档 。 因 此 ,短语 识别 
也 是 智能 化 引擎 关注 的 一 种 技术 。 

(4) 同义词 技术 。 

处 理 同义词 的 一 种 方法 是 人 工 构 造 同义词 表 。 对 专用 领域 的 搜索 引擎 ,这 种 方法 是 
非常 有 效 的 。 另 外 一 种 方法 是 从 语料库 中 自动 取得 同义词 关系 。 给 出 一 个 查询 的 关键 
词 , 引 擎 能 主动 “联想 ”到 与 其 同 义 或 意思 相近 的 词 。 

2) 对 称 搜索 技术 

“发 布 信息 ”和 “检索 信息 ”是 一 种 对 称 的 信息 沟通 需求 。 因 此 ,我 们 可 以 建立 发 布 信 
息 和 检索 信息 的 对 称 数 据 库 和 对 称 搜索 技术 。 

对 称 搜索 的 实现 关键 在 于 好 的 “对 称 信 息 摘要 通用 模板 ”的 建立 。 任 何 用 户 在 发 布 信 
息 时 都 要 在 “对 称 信息 摘要 通用 模板 ”上 输入 信息 ,其 中 包括 发 布 /获取 选择 、 数 据 类 型 .内 
容 摘 要 ,发 布 者 域名 、 邮 件 地 址 \ 发 布 起 止 时 间 等 ;同样 ,信息 搜索 用 户 也 在 “对 称 信息 摘 要 
通用 模板 ”上 输入 信息 ;搜索 引擎 根据 用 户 要 求 , 对 “对 称 信 息 摘要 数据 库 ” 进 行 多 次 匹配 
并 排序 ,而 后 根据 对 称 信息 双方 提供 的 地 址 进行 匹配 结果 双向 自动 推送 ,让 用 户 选 择 是 否 
链接 至 相关 站 点 的 详细 内 容 。 

对 称 搜索 技术 使 对 称 信息 匹配 的 准确 度 空前 提高 :一 次 性 搜索 可 多 次 享用 不 同时 间 
的 搜索 结果 ,使 用 户 搜 索 操作 简便 ;摘要 数据 库 与 全 文 数据 库 相 比 , 不 会 无 限 膨胀 ;由 发 布 
信息 方 自行 提供 摘要 信息 和 保留 时 间 , 加 上 摘要 数据 库 空 间 占 用 收费 ,这 实际 上 是 控制 垃 
圾 信息 的 最 有 效 手段 ,从 而 使 垃圾 信息 大 幅度 减少 。 

另外 ,如 果 能 够 提供 “对 称 信息 ”的 高 质量 多 语种 转换 技术 , 便 可 实现 无 语言 障碍 的 
“对 称 信息 ”全 球 通用 检索 服务 。 而 “文本 语义 人 机 交互 统一 编码 技术 ”全 域 数码 知识 信 
息 定位 技术 ”将 可 能 在 解决 多 语种 翻译 质量 问题 上 取得 决定 性 突破 。 因 此 ,在 很 短 时 间 
内 , 单 语种 “对 称 信 息 检索 服务 ”将 进入 普及 阶段 ;不 久 的 将 来 ,用 户 即 可 享受 到 可 靠 实用 
的 “多 语种 通用 对 称 信息 检索 ”服务 。 

3) 基于 XML 的 技术 

XML 将 使 Web 的 搜索 非常 方便 。XML( 可 扩展 标记 语言 ) 是 Web 数据 使 用 的 通用 
语言 ,具有 结构 化 ,规范 性 、 可 扩展 性 及 简洁 的 特点 。XML 能 让 开发 人 员 将 来 自 各 种 应 
用 程序 的 结构 化 数据 传送 给 桌面 ,以 在 本 地 计算 和 表示 。XML 允许 为 特定 应 用 程序 创 
建 独特 的 数据 格式 , 它 还 是 结构 化 数据 从 服务 器 到 服务 器 传输 的 理想 格式 。XML 是 在 
超级 分 布 式 系统 之 间 实 现 多 数据 集 传输 的 一 种 手段 。 它 同时 可 以 使 开发 人 员 以 更 具 价 值 
的 新 型 方式 聚集 和 组 合 各 种 来 源 的 数据 。XML 将 成 为 Internet 上 最 重要 的 基础 性 语言 。 

XML 通过 DTD 定义 了 文档 的 词法 .语法 和 部 分 语义 ,XML 规定 了 文档 的 表现 形 
式 , 而 XLink 和 XPointer 定义 了 文档 之 间 的 关系 ,从 而 为 基于 Web 的 各 种 应 用 提供 了 一 
个 描述 数据 和 交换 数据 的 有 效 手段 。 如 果 说 HTML 提供 了 显示 全 球 数据 的 通用 方法 ， 
那么 XML 进一步 提供 了 处 理 全 球 数 据 的 通用 方法 。XML 继承 了 SGML 的 强大 功能 ， 
又 充分 采取 了 HTML 的 “ 易 用 ”原则 。 它 实现 了 国际 性 的 媒体 无 关 的 电子 出 版 ,使 工业 
界 能 够 定义 平台 无 关 的 数据 交换 协议 ,特别 是 电子 商务 中 的 数据 交换 协议 。 资 源 标注 、 编 
目 和 描述 是 信息 查找 的 基础 ,结构 化 的 资源 (XML) 和 资源 的 描述 框架 (RDF) 互 相配 合 ， 
将 大 大 提高 信息 查找 效率 。XML 简化 元 数据 的 提取 工作 ,从 而 协助 人 们 寻找 信息 ,并 协 
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助 信息 生产 者 和 信息 消费 者 的 相互 发 现 。 如 果 说 在 网 络 的 支持 下 ,HTML 解决 了 在 异 构 
台 间 传送 数据 和 文档 ,那么 ,基于 XML 的 VRML 和 SMIL 解决 了 在 异 构 平 台 间 传送 

感受 的 可 能 性 问题 。 使 用 XML, 人 们 可 以 利用 设备 的 智能 去 访问 不 同 的 网 站 ,并 对 信息 
进行 集中 。XML 使 我 们 迈 向 将 控制 信息 的 权利 交 给 那些 需要 信息 的 人 们 。 由 于 所 有 文 
件 都 以 XML 格式 存在 ,所 有 的 用 户 都 可 以 方便 地 查找 和 使 用 其 中 的 信息 ,任何 规模 的 文 
化 机 构 都 可 以 使 用 相同 的 工具 与 资源 。 内 容 供 应 者 、 合 作 伙伴 和 信息 内 容 消 费 者 可 以 高 
效 地 沟通 和 共享 信息 ,这 样 就 创造 出 了 一 种 全 新 的 协同 工作 模式 。 

4) 图 谱 搜索 

图 谱 搜 索 是 基于 社交 图 谱 构建 起 来 的 搜索 服务 。 社 交 图 谱 由 互联 网 数据 中 的 实体 以 
及 实体 与 实体 之 间 的 关系 构成 。 其 中 ,实体 是 结 点 ,关系 是 边 。 互 联网 中 的 用 户 、 页 面 、. 地 
点 ` 照 片 , 网 帖 等 信息 均 可 由 结 点 表示 ,实体 之 间 的 关系 (如 朋友 关系 .雇佣 关系 等 ) 则 由 边 
表示 。 从 语言 学 的 角度 描述 ,实体 可 以 类 比 为 名 词 短语 ,而 边 可 以 类 比 为 动词 短语 。 根 据 
2013 年 1 月 的 统计 ,社交 图 谱 包含 约 10 亿 个 用 户 、1500 亿 条 朋友 链接 .2400 亿 张 照片 
(照片 以 每 天 3. 5 亿 张 的 数量 增加 ) 以 及 27 亿 条 推荐 信息 。 由 此 可 见 , 社 交 图 谱 的 数据 量 
巨大 。 

脸谱 (Facebook) 于 2013 年 1 月 15 日 推出 了 图 谱 搜 索 (graph search) 测 试 版 ,该 功能 
可 以 看 作 是 基于 社交 图 谱 (social graph) 的 语义 搜索 服务 。 登 录用 户 在 使 用 脸谱 搜索 框 
时 ,能 在 下 拉 菜 单 中 使 用 好 友 、 照片. 地 点 和 兴趣 等 新 的 搜索 选项 。 例 如 , 当 用 户 输入 
“Restaurants liked by my friends”( 我 朋友 们 喜欢 的 餐馆 ) 时 ,图 谱 搜索 将 呈现 用 户 的 全 
部 脸谱 好 友 推 荐 的 餐厅 列表 。 与 基于 关键 词 匹配 的 传统 网 络 搜索 引擎 相 比 ,图 谱 搜索 能 
够 支持 更 自然 、 复 杂 的 查询 输入 ,并 针对 查询 直接 给 出 答案 。 与 搜索 引擎 关键 词 自动 补足 
功能 类 似 , 图 谱 搜索 会 在 用 户 输 入 时 同步 预测 用 户 搜索 意图 ,并 根据 用 户 选择 进行 查询 扩 
展 。 例 如 ,在 用 户 输 入 "My friends who" 后 ,图 谱 搜索 会 询问 用 户 是 否 希 望 继 续 搜索 “My 
friends who live in Beijing” 或 “My friends who work at Microsoft” 等 。 对 此 ,脸谱 的 
Keith Peiris 表示 :“ 我 们 希望 用 户 能 忘记 以 往 使 用 搜索 引擎 的 方式 , 即 输 入 若干 模糊 的 
关键 词 ;相反 ,他 们 可 以 准确 表达 希望 获得 什么 .此 外 ,图 谱 搜 索 还 具备 个 性 化 的 特点 , 即 
针对 用 户 提出 的 查询 ,图 谱 搜 索 仅 仅 在 与 用 户 直接 相关 的 事物 中 进行 搜索 并 给 出 答案 。 
这 样 做 既 能 解决 潜在 的 隐私 问题 ,又 能 为 用 户 提供 与 其 自身 社交 网 络 密 切 相关 的 信息 。 

除 脸 谱 外 ,信息 技术 领域 的 其 他 巨头 也 先后 推出 了 类 似 的 基于 结构 化 数据 的 搜索 产 
品 或 服务 ,作为 其 进军 和 探索 下 一 代 搜 索引 擎 技术 的 桥头 堡 和 试验 田 。 

Watson 是 由 IBM 公司 研发 的 自动 问答 系统 。 在 对 输入 问题 计算 答案 的 过 程 中 , 基 
于 知识 库 的 问答 模块 起 到 了 显著 作用 。 实 验 表明 ,虽然 该 模块 能 够 回答 的 问题 数目 占 全 
部 问题 数目 的 比例 并 不 大 ,但 回答 问题 的 准确 度 却 远 高 于 其 他 问答 模块 。 可 以 预见 , 随 着 
知识 库 的 不 断 更 新 ,以 及 对 自然 语言 理解 技术 研究 的 深入 ,基于 知识 库 的 问答 模块 必定 会 
在 自动 问答 系统 中 起 到 越 来 越 重要 的 作用 。 目 前 , Watson 已 应 用 于 医疗 ,金融 等 多 个 
领域 。 

谷歌 提出 了 知识 图 谱 的 概念 ,并 推出 了 基于 知识 图 谱 的 新 型 搜索 服务 。 知 识 图 谱 从 
本 质 上 讲 是 一 个 知识 库 ,基于 知识 图 谱 的 搜索 服务 则 可 以 看 作 是 一 个 典型 的 自动 问答 系 
统 。 与 传统 网 页 搜索 相 比 , 基 于 知识 图 谱 的 搜索 能 够 更 好 地 理解 用 户 的 搜索 意图 ,并 对 相 
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关内 容 和 主题 进行 总 结 。 例 如 , 当 输入 "Bill Gates” 时 ,用 户 不 仅 可 以 获得 这 个 关键 词 的 
全 部 信息 ,还 能 获取 关于 Bill Gates 的 介绍 。 知 识 图 谱 还 能 够 提供 搜索 结果 的 详细 知识 
体系 ,帮助 用 户 从 更 多 角度 了 解 搜索 结果 的 相关 信息 。 

微软 公司 通过 提取 网 页 中 的 非 结构 化 数据 ,构建 了 结构 化 的 知识 库 Satori, 用 于 从 语 
义 层面 提高 和 改进 必 应 的 搜索 质量 。 此 外 ,与 谷歌 的 知识 图 谱 搜 索 类 似 , 当 用 户 输入 的 查 
询 语句 能 够 被 后 台 自 然 语言 处 理 模块 解析 时 , 必 应 将 触发 自动 问答 模块 ,基于 Satori 知识 
库 生 成 答案 ,并 将 生成 的 结果 及 其 相关 知识 直接 返回 给 用 户 。 

互联 网 上 知识 的 指数 级 增长 使 得 人 们 已 经 不 满足 于 传统 搜索 服务 的 模式 , 即 仅仅 返 
回 与 用 户 查 询 相关 的 若干 文档 链接 ,用 户 更 渴望 获得 针对 其 提出 问题 的 准确 回答 。 随 着 
结构 化 数据 库 的 规模 扩大 、 自 然 语言 理解 技术 的 深化 ,针对 查询 进行 精确 理解 和 回答 的 搜 
索 服务 必 将 越 来 越 实用 化 。 基 于 结构 化 数据 (知识 库 ) 和 语义 理解 的 搜索 技术 在 一 定 程度 
上 代表 了 搜索 引擎 技术 的 发 展 趋势 ,所 具有 的 特点 能 够 更 好 地 满足 用 户 对 搜索 服务 新 的 
需求 : 能 够 对 自然 语言 查询 进行 深入 的 理解 ,并 从 语义 层面 解析 用 户 查 询 意图 ;能 够 利用 
海量 的 结构 化 知识 库 针 对 用 户 查询 提供 准确 的 答案 。 

充分 利用 结构 化 大 数据 ,深入 理解 用 户 自然 语言 查询 并 针对 查询 给 出 准确 的 答案 ,能 
够 更 好 地 满足 人 类 对 知识 获取 的 需求 ,同时 也 代表 了 计算 和 搜索 的 未 来 。 


8.6.4 搜索 引擎 的 发 展 趋势 


随 着 移动 计算 ,社会 计算 和 云 计算 等 技术 的 成 熟 和 发 展 ,搜索 引擎 向 移动 搜索 、 社 区 
化 搜索 \ 微 博 搜 索 \ 云 搜索 和 交互 式 搜索 意图 理解 几 个 方向 发 展 。 

随 着 智能 移动 设备 迅速 普及 ,搜索 行为 逐渐 过 渡 到 移动 端 , 用 户 期 望 以 自然 语言 表达 
搜索 需求 ,直接 获取 正确 答案 ,语音 和 图 像 等 感知 技术 .自然 语言 处 理 、 知 识 图 谱 、 用 户 理 
解 等 认 知 技术 与 搜索 相 结合 ,推动 搜索 引擎 向 智能 化 演进 ,进而 带动 了 信息 获取 和 交互 方 

智能 搜索 融合 自然 语言 处 理 、 知 识 图 谱 、 用 户 理解 ,深度 学 习 等 技术 ,实现 了 对 用 户 搜 
索 需求 的 理解 ,对 内 容 的 理解 以 及 对 知识 的 掌握 和 运用 ,从 而 为 用 户 提 供 更 直观 、 更 准确 
高 效 的 信息 、 知 识 和 服务 。 

1. 移动 搜索 

随 着 智能 手机 的 普及 ,手持 设备 搜索 将 成 为 未 来 搜索 引擎 发 展 的 重要 方向 。 

手持 设备 通常 为 个 人 所 专 有 ,这 就 为 搜索 个 性 化 .广告 定向 投放 基于 地 理 位 置信 息 
的 服务 等 提供 了 天 然 的 优势 平台 ,有 望 借 此 达到 更 加 准确 的 识别 用 户 信息 需求 ,更 加 精准 
的 投放 广告 的 目标 。 而 手持 设备 本 身 由 于 屏幕 大 小 、 运 算 能 力 的 限制 又 需要 对 传统 的 互 
联网 资源 进行 重新 整理 ,以 便 用 户 更 便捷 地 加 以 利用 ,这 一 整理 工作 往往 需要 搜索 引擎 协 
助 用 户 完成 ,这 又 为 搜索 引擎 技术 (尤其 是 用 户 交互 技术 ) 的 发 展 提出 了 挑战 。 

在 日 常生 活 中 ,人 们 经 常会 碰 到 很 多 “Now and Here” 的 问题 ,需要 查询 与 其 正在 进 
行 的 活动 相关 的 信息 : 我 的 朋友 现在 位 于 什么 位 置 ? 电影 院 现在 正在 放映 什么 电影 7 离 
自己 位 置 最 近 的 影院 有 无 剩余 的 票 ? 附近 有 没有 比较 好 的 餐馆 ? 现在 有 一 些 什么 优惠 活 
动 ? 我 需要 停车 ,现在 最 近 的 有 停车 位 的 停车 场 在 哪里 ? 
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移动 搜索 与 互联 网 搜索 存在 着 本 质 区 别 , 主 要 表现 在 搜索 方式 、 搜 索要 求 .搜索 渠道 
和 搜索 内 容 等 多 个 方面 , 详 见 表 8-1。 
表 8-1 移动 Web 搜索 与 互联 网 搜索 的 差异 











移动 Web 搜索 互联 网 搜索 
功能 单一 、 普 及 率 高 .携带 方便 、 承 载 网 络 覆 盖 | 功能 丰富 、 普 及 率 低 、 承 载 网 络 覆 
终端 特点 面 大 盖 面 
盖 面 小 
搜索 方式 | 关键 字 搜索 .自然 语句 搜索 目录 检索 .关键 字 搜索 
搜索 要 求 | 准确 性 、 便 捷 性 个 性 化 准确 性 海量 性 ,快速 性 





搜索 渠道 | 短信 人、 搜索 门户 、 搜 索 栏 TVR( 互 动 式 语音 应 答 ) | 搜索 门户 、 搜 索 栏 .浏览 器 地 址 栏 
Wap 网 站 内 容 、 传 统 互联 网 内 容 、 运 营 商 及 服务 | 以 互联 网 网 站 内 容 为 主 ,信息 量 十 





搜索 内 容 

















提供 商 内 容 、 传 统 信息 提供 商 及 黄页 内 容 分 丰富 
搜索 目的 | 搜索 需要 的 内 容 、 定 制 需要 的 服务 搜索 需要 的 内 容 和 站 点 
搜索 限制 | 无 存在 网 络 接 入 限制 
搜索 费用 | 流量 费 、 服 务 定制 费 等 免费 


在 移动 环境 下 ,根据 移动 用 户 的 需求 ,准确 地 标记 Web 资源 的 地 理 位 置 ,并 将 用 户 上 
下 文 信息 (如 位 置 .时 间 等 ) 与 Web 中 的 数据 结合 起 来 回答 提出 的 搜索 ,在 此 基础 上 进行 
高 效 的 面向 移动 用 户 的 查询 处 理 , 获 得 高 度 精确 的 满足 用 户 需求 的 结果 ,从 而 为 用 户 提供 
“Nearby Now” 的 服务 ,都 具有 非常 重要 的 研究 价值 ,为 3G 时 代 下 的 移动 Web 搜索 提供 
了 一 条 新 思路 ,具有 十 分 广阔 的 应 用 前 景 。 

2. 社区 化 搜索 

以 Facebook、 人 人 网 等 为 代表 的 社会 网 络 服务 (SNS) 站 点 的 迅速 崛起 无 疑 是 2010 
年 互联 网 应 用 范畴 最 重要 的 事件 之 一 ,Facebook 取代 谷歌 成 为 美国 市 场 上 用 户 停留 时 间 
最 长 的 网 站 更 是 成 为 媒体 关注 的 焦点 。 截 至 2017 年 6 月 ,我 国手 机 网 民 规 模 达 7. 24 亿 ， 
较 2016 年 年 底 增加 2830 万 人 。 网 民 使 用 手机 上 网 的 比例 由 2016 年 年 底 的 95. 1% 提 升 
至 96.3%。 

在 SNS 覆盖 大 多 数 网 民 的 情况 下 ,一 种 将 网 络 交友 与 信息 搜索 行为 加 以 融合 的 社区 
化 搜索 概念 应 运 而 生 。 针 对 传统 搜索 引擎 面临 的 信息 质量 较 低 、 难 以 直接 提供 答案 等 挑 
战 性 问题 ,社区 化 搜索 提出 在 搜索 的 过 程 中 融合 人 的 因素 ,用 户 提 出 查询 后 ,系统 首先 通 
过 SNS 服务 中 提供 的 好 友 关 系 寻 找 其 好 友 群 体 中 最 适合 回答 该 问题 的 用 户 , 再 提供 必要 
的 搜索 工具 协助 该 用 户 回 答 问 题 。 由 于 在 传统 的 搜索 流程 中 添加 了 人 的 因素 ,因此 可 以 
大 大 提升 搜索 质量 ,并 增加 用 户 对 系统 的 信任 度 和 黏 性 。 

目前 ,此 类 社区 化 搜索 产品 还 停留 在 概念 阶段 ,考虑 到 百度 、 谷 歌 等 传统 搜索 引擎 巨 
头 对 SNS 模式 的 重视 以 及 在 搜索 社区 产品 上 的 经 验 积累 ,社区 化 搜索 在 不 久 的 将 来 有 望 
从 概念 走向 现实 应 用 。 

3. 微 博 搜索 

以 新 浪 微 博 搜 索 为 例 , 目 前 新 浪 微 博 搜 索 提供 实时 和 热门 两 种 微 博 搜索 结果 排序 方 
式 , 虽 然 没 有 传统 搜索 引擎 那么 精准 和 权威 ,但 相 比 传统 搜索 引擎 , 微 博 搜 索 已 经 体现 出 
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一 定 的 优势 。 微 博 搜索 将 以 与 传统 搜索 引擎 完全 不 同 的 形态 存在 ,甚至 有 可 能 成 为 Web 
2.0 时 代 规 则 的 制定 者 。 

(1) 在 新 闻 和 突 发 事件 的 时 效 性 方面 , 微 博 的 效率 和 传播 速度 远 超 传统 媒体 。 微 博 
搜索 将 因此 受益 。 

(2) 在 搜索 的 简便 性 上 , 微 博 有 一 个 潜在 的 优势 , 那 就 是 用 # 标 记 的 “话题 ”", 如 #36 
氮 开 放 日 # ,用 户 只 要 在 微 博 内 容 中 单 击 这 个 话题 ,就 会 得 到 搜索 结果 ,非常 方便 。 

(3) 自 媒体 丰富 了 每 个 热门 事件 的 角度 和 深度 ,而 拥有 自 媒体 平台 的 是 微 博 , 而 不 是 
搜索 引擎 。 换 句 话说 ,这 些 用 户 产生 的 内 容 是 在 微 博 里 的 ,搜索 引擎 想 检索 这 些 内 容 会 很 
有 难度 。 对 于 话题 类 的 搜索 结果 ,用 户 最 希望 看 到 的 就 是 大 家 七 嘴 八 舌 地 发 表 自己 的 看 
法 ,对 此 显然 微 博 搜 索 可 以 做 得 更 及 时 、 更 新 、 更 全 面 。 

(4) 在 某 个 人 的 个 人 信息 搜索 上 , 微 博 搜 索 体现 出 前 所 未 有 的 优势 。 例 如 ,在 微 博 上 
搜索 “ 何 思 奇 ”, 可 以 在 搜索 结果 中 看 到 他 最 近 都 跟 谁 一 块 玩 ,参加 了 哪些 活动 ,他 的 行踪 
暴露 无 遗 。 且 不 谈 个 人 隐私 的 问题 ,如 此 全 方位 地 对 一 个 人 的 行为 完成 全 面 的 追踪 ,这 对 
于 传统 搜索 引擎 是 不 可 能 完成 的 。 

(5) 微 博 搜索 结果 呈现 的 方式 更 直接 。 微 博信 息 量 很 小 ,这 些 短文 本 可 以 直接 呈现 
在 搜索 结果 里 , 翻 两 页 基本 就 了 解 了 事件 的 全 瑶 ,而 不 像 百度 一 样 需要 再 点 进 某 网 站 内 进 
行 浏览 ,这 在 某 种 程度 与 百度 的 框 计算 * 所 搜 即 所 得 "有些 相似 。 

(6) 碎片 搜索 的 目的 是 搜索 碎片 ,请 不 要 觉得 这 句 话 是 废话 ,因为 必须 重新 审视 我 们 
的 搜索 目的 。 移 动 互 联网 带领 我 们 进入 碎片 化 时 代 , 而 碎片 化 信息 的 整合 也 必 将 给 微 博 
搜索 带 来 大 量 机 会 ,足够 的 信息 给 微 博 搜 索 以 用 武之 地 ,也 给 了 它 足 够 的 成 长 空间 。 

4. 云 搜 索 

暗 网 数据 (deep web data) 指 目前 搜索 引擎 无 法 抓 取 的 信息 。 这 部 分 数据 分 为 两 类 : 
一 类 是 由 于 技术 实现 的 原因 无 法 抓 取 , 如 很 多 网 站 本 身 不 符合 协议 规范 ,导致 搜索 引擎 的 
息 虫 无 法 识别 这 些 网 站 内 容 并 抓 取 ; 另 一 类 是 不 少 网 站 提供 的 存储 在 网 络 数据 库 中 的 内 
容 ,搜索 引擎 难以 通过 网 页 抓 取 的 方式 获取 其 全 部 信息 内 容 。 由 于 暗 网 数据 在 互联 网 资 
源 中 占有 相当 大 的 比重 ,因此 如 何 获取 其 中 有 价值 的 内 容 就 成 为 搜索 引擎 竞相 研究 的 重 
点 技术 。 然 而 ,网 络 数据 库 的 异 构 特 性 和 网 络 数据 的 繁杂 使 得 绝 大 多 数 的 相关 技术 并 没 
有 取得 很 好 的 效果 。 在 这 种 情况 下 ,搜索 引擎 基于 搜索 社区 和 用 户 产生 内 容 (UGC) 提 升 
搜索 质量 的 尝试 可 能 成 为 一 个 有 益 的 借鉴 。 

基于 这 一 思路 ,百度 的 “阿拉 丁 计划 ”谷歌 的 “整合 搜索 ”等 项 目 先后 推出 ,通过 这 些 
方式 ,搜索 引擎 希望 网 站 作者 规范 化 其 内 容 形式 并 主动 提供 给 搜索 引擎 ,以 便 后 者 能 够 更 
好 地 利用 这 部 分 内 容 为 用 户 服 务 。 然 而 ,这 种 合作 方式 面临 着 如 何 调动 网 民 群 体 和 网 站 
主 群 体 的 积极 性 的 问题 ,由 于 暗 网 数据 提供 商 仍旧 需要 通过 传统 搜索 引擎 平台 提供 信息 
服务 ,难以 很 好 地 增加 用 户 对 本 网 站 的 关注 。 因 此 ,这 类 合作 方式 往往 由 于 缺乏 合适 的 商 
业 模 式 , 难 以 对 本 身 具 有 较 大 用 户 群 体 的 暗 网 数据 提供 商 形成 吸引 力 。 

针对 暗 网 数据 获取 与 整合 问题 ,部 分 研究 人 员 提 出 了 以 分 布 式 方式 整合 垂直 搜索 与 
通用 搜索 资源 ,为 用 户 提供 更 好 的 信息 获取 服务 的 云 搜索 服务 概念 。 云 搜索 引擎 不 通过 
独立 收集 存储 海量 规模 数据 的 方式 提供 搜索 服务 ,而 是 提供 一 个 容纳 互联 网 中 垂直 与 通 
用 搜索 资源 并 加 以 整合 、 提 供用 户 使 用 的 服务 框架 。 云 搜索 包括 搜索 资源 发 现 、 用 户 需 求 
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深度 理解 .搜索 资源 管理 ,信息 资源 整合 等 关键 技术 模块 ,一 方面 以 分 布 式 的 方式 实现 对 
搜索 资源 的 按 需 调度 使 用 ,不 与 搜索 资源 提供 商 构成 用 户 群 体 上 的 竞争 关系 ; 另 一 方面 ， 
借助 云 搜索 用 户 的 海量 用 户 行为 信息 挖掘 分 析 , 对 搜索 资源 的 服务 效率 、 信 息 资源 等 性 能 
因素 进行 评估 ,并 以 此 提高 用 户 服 务 质量 。 

尽管 云 搜索 从 原理 上 能 够 为 用 户 提供 更 优质 的 搜索 服务 ,但 由 于 其 特殊 的 服务 提供 
形式 ,导致 其 技术 与 产品 发 展 需要 借助 互联 网 桌面 产品 的 发 展 经 验 。 同 时 , 云 搜 索 技术 面 
临 的 用 户 需 求 理解 .搜索 资源 管理 等 技术 挑战 也 是 制约 其 能 否 破 草 而 出 的 重要 因素 。 

5. 交互 式 搜索 意图 理解 : 超越 传统 搜索 的 信息 发 现 

根据 用 户 行为 分 析 的 最 新 研究 进展 ,用 户 搜 索 行为 中 有 相当 比例 属于 “信息 探索 ”的 
范畴 ,用 户 在 进行 这 类 搜索 时 ,其 信息 需求 往往 较为 复杂 并 且 具 有 动态 演化 的 特性 。 用 户 
因而 面临 着 如 何 构建 合适 的 查询 ,以 表述 其 信息 需求 ,进而 查找 到 所 需 信 息 的 问题 。 

现代 搜索 引擎 在 协助 用 户 完成 复杂 查询 任务 方面 的 能 力 仍 极为 有 限 ,用 户 需 要 将 大 
量 认 知 精力 耗费 在 寻找 导航 提示 上 ,这 使 得 阅读 和 选择 所 需 信息 的 过 程 不 可 避免 地 受到 
影响 。 交 互 式 搜索 意图 理解 通过 计算 建 模 和 可 视 化 交互 的 方式 协助 用 户 进 行 信 息 探索 ， 
通过 有 效 的 交互 界面 使 得 用 户 有 效 获取 信息 。 在 进行 任务 级 别 的 信息 查找 时 ,交互 式 搜 
索 意 图 理解 能 够 极 大 提高 用 户 的 信息 获取 效率 (提升 超过 100%)。 

交互 式 搜索 意图 理解 技术 能 够 超越 传统 搜索 实现 发 现 信息 的 功能 。 在 交互 式 搜索 意 
图 理解 技术 的 支持 下 ,搜索 引擎 系统 挖掘 可 能 与 用 户 需 求 相关 的 搜索 意图 ,并 将 这 些 意图 
通过 可 视 化 的 方式 展现 在 当前 需求 的 周围 ,用 户 可 以 对 这 些 搜索 意图 进行 选择 ,搜索 引擎 
会 根据 用 户 的 选择 实时 修正 对 用 户 搜索 意图 的 评估 。 

交互 式 搜索 意图 理解 系统 基于 如 下 两 个 原则 进行 设计 : 四 可 视 化 : 系统 需要 能 够 
将 用 户 的 信息 需求 和 可 能 的 搜索 意图 在 二 维 信息 空间 中 加 以 可 视 化 展示 ; 加 动态 调 
整 : 由 于 用 户 的 反馈 通常 是 有 限 且 偏颇 的 ,因此 ,系统 建立 的 用 户 意图 模型 必须 能 够 对 
不 确定 性 加 以 处 理 , 并 且 有 效 地 平衡 用 户 在 信息 空间 中 的 广度 探索 与 深度 挖掘 这 两 方 
面 的 需求 。 

通过 对 用 户 查 询 和 数据 元 素 ( 如 关键 词 等 ) 的 可 视 化 ,交互 式 搜索 意图 理解 系统 能 够 
展示 其 对 用 户 搜 索 意 图 的 理解 ,并 将 当前 的 查询 需求 和 可 能 的 搜索 意图 发 展 方向 在 信息 
空间 中 加 以 展示 。 在 查询 过 程 之 初 ,搜索 引擎 对 用 户 信息 需求 的 理解 往往 十 分 有 限 ,这 要 
求 系统 需要 能 够 在 初始 查询 输入 时 即 可 对 用 户 意图 加 以 预测 。 将 用 户 意图 及 他 们 之 间 的 
关系 展示 在 信息 空间 之 后 ,用 户 能 够 对 该 模型 进行 必要 的 反馈 ,系统 依据 反馈 信息 更 新 其 
对 用 户 意图 的 评估 ,并 返回 相应 检索 信息 ,更 新 信息 空间 的 展示 。 

SciNet 科技 文献 搜索 系统 是 一 个 依照 交互 式 搜索 意图 理解 技术 的 两 大 原则 设计 实 
现 的 信息 检索 系统 。 该 系统 目前 已 经 索引 了 超过 5000 万 篇 科技 文献 , 旨 在 协助 用 户 更 好 
地 理解 初始 查询 内 容 , 并 通过 反馈 迭代 快速 定位 到 特定 研究 领域 的 相关 文献 。 

为 推动 用 户 更 加 主动 地 参与 到 搜索 系统 交互 反馈 的 机 制 中 ,以 便 提升 其 信息 探索 与 
知识 获取 的 水 平 , 需 要 搜索 交互 技术 跳出 传统 的 “关键 词 查 询 框 十 结果 列表 展示 ”的 旧 模 
式 , 以 便 用 户 能 够 更 有 效 地 与 系统 进行 交流 ,并 更 好 地 掌控 其 信息 发 现 的 过 程 。 在 交互 过 
程 中 ,基于 包含 大 量 噪 声 的 用 户 反馈 信息 实时 对 意图 进行 理解 建 模 是 非常 困难 的 过 程 , 需 
要 机 器 学 习 模 型 具有 在 线 学 习 与 扩展 的 能 力 。 信 息 检 索 系 统 的 设计 过 程 也 必须 最 终 整 合 
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包括 交互 可 视 化 、 意 图 预测 、 多 模 态 反馈 等 方面 的 技术 ,还 需要 对 任务 和 目标 级 别 的 高 层 
上 下 文 信息 有 充分 的 认 知 。2018 年 4 月 ,谷歌 上 线 Semantic Experiences( 语 义 体验 ) 网 
站 ,网 站 有 两 项 特殊 功能 : 一 是 “Talk to Books”( 撩 书 ); 二 是 名 为 Semantris 的 语义 联想 
游戏 。 这 两 个 功能 都 基于 自然 语言 文本 理解 ,用 户 能 够 凭 语义 而 非 关 键 词 实现 搜索 功能 。 

与 简单 的 定位 相关 文档 相 比 ,我 们 需要 检索 系统 在 协助 人 类 完成 信息 获取 任务 方面 
发 挥 更 大 的 作用 。 用 户 因而 需要 一 种 适应 其 信息 获取 能 力 与 行为 模式 的 搜索 引擎 系统 ， 
而 不 是 只 被 动 地 适应 系统 本 身 。 


8.7 机 器 翻译 


机 器 翻译 的 发 展 大 致 分 为 如 下 5 个 阶段 : 初创 期 (1956 年 前 ); @ 从 狂热 的 高 预期 
到 平静 的 觉醒 (1958 一 1966 年 ); @ 低 谷 期 (1968 一 1976 年 ); 图 恢复 期 (1976 一 1989 年 )， 
商业 性 的 机 器 翻译 系统 相继 推出 ; @ 新 的 发 展期 (1990 年 后 ) 。 

20 世纪 80 年 代 , 人 们 开始 提出 多 种 机 器 翻译 方法 ,新 方法 更 加 重视 真实 的 翻译 语 
料 , 期 望 从 真实 语 料 中 获得 对 翻译 有 用 的 信息 。 其 方法 包括 翻译 记忆 (Translation 
Memory,TM) ,基于 实例 的 机 器 翻译 (Example Based Machine Translation, EBMT) 和 统 
计 机 器 翻译 (Statistical Machine Translation,SMT)。 其 中 ,SMT 已 经 成 为 目前 机 器 翻译 
研究 的 主流 方法 。 

高 质量 的 翻译 系统 不 但 需要 对 原文 的 内 在 组 成 语法 结构 进行 把 握 ,而 且 需 要 了 解 各 
组 成 单位 之 间 复 杂 的 相互 作用 关系 , 即 语法 ,语义 和 语 用 等 知识 。 此 外 ,上 下 文 环境 、 相 关 
的 常识 都 是 正确 翻译 的 必需 知识 。 因 此 , 随 着 研究 的 深入 和 相关 技术 的 发 展 ,翻译 系统 也 
逐渐 从 词法 型 .语法 型 发 展 到 语义 型 。 

I bought a table with three legs. (我 买 了 一 张 有 三 条 腿 的 桌子 。) 

I bought a table with three dollars. (我 花 三 美元 买 了 一 张 桌子 。) 

计算 机 要 翻译 这 两 句 话 , 却 碰 到 了 不 易 处 理 的 歧义 结构 问题 。 





8.7.1 机 器 翻译 系统 概述 


1. SYSTRAN 翻译 系统 

国际 上 使 用 最 广泛 的 机 器 翻译 系统 为 SYSTRAN 系统 。SYSTRAN 系统 历史 轨迹 
如 下 。 

(1) 1949 年 , Doster (资深 翻译 工作 者 , 曾 任 艾森豪威尔 将 军 的 个 人 翻译 ) 在 
Gerorgetown 大 学 的 外 语 服务 学 院 创 建 了 语言 和 语言 学 研究 所 ,开始 机 器 翻译 研究 ,负责 
Gerorgetown 系统 建设 。 实 现 的 系统 被 命名 为 SERNA (俄语 中 “俄语 到 英语 ”的 字 头 缩 
写 ), 也 称 作 GAT(Gerorgetown Automatic Translation) 系统 。 

(2) SERNA 的 实现 工作 是 由 Peter Toma 完成 的 。1963 年 位 于 意大利 Ispra 的 欧洲 
原子 能 机 构 (EUROTOM) 、1964 年 美国 原子 能 委员 会 下 属 的 Oak Ridge 国家 实验 室 分 别 
安装 了 该 系统 。 该 系统 在 这 两 处 工作 长 达 15 年 之 久 , 后 来 均 被 SYSTRAN 系统 取代 。 
SERNA 系统 代表 着 机 器 翻译 研究 早期 在 系统 构建 方面 的 最 高 成 就 。 
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(3) 1964 年 ,Toma 移居 德国 ,正式 开始 SYSTRAN 系统 的 研究 。1968 年 ,Toma 又 
在 美国 加 州 创 建 了 相关 公司 (Latsec 公司 ) ,为 美国 空军 (USAF) 开 发 俄 英 翻 译 系统 。 
1970 年 7 月 ,SYSTRAN 开始 为 美国 空军 外 国 技术 局 提供 翻译 服务 。1974 一 1975 年 ， 
NASA 在 美 苏 联合 太空 计划 (apollo-soyuz project) 中 也 使 用 了 SYSTRAN 系统 提供 翻译 
服务 。 

(4) 为 了 与 欧洲 共同 体 进行 合作 ,Toma 成 立 了 WTC(World Translation Center) 公 
司 ,欧洲 共同 体 与 WTC 合作 开始 开发 机 器 翻译 系统 ,目标 是 进行 欧洲 共同 体 语 言 间 的 翻 
译 。WTC 先后 研制 出 英法 .法 英 、 英 意 机 器 翻译 系统 。1981 年 3 月 ,这 些 系统 在 卢森堡 
提供 试 运行 服务 ,并 不 断 增加 了 对 其 他 语言 的 支持 。 世 界 各 地 陆续 出 现 了 许多 公司 推广 
和 开发 的 SYTRAN 系统 。1986 年 ,法 国 Gachot 公司 最 终 收购 了 这 些 公 司 并 继续 
SYSTRAN 系统 的 开发 工作 。 

(5) SYSTRAN 是 目前 应 用 最 广泛 的 翻译 软件 。 它 支持 俄语 ,英语 、 法 语 、 德 语 、 意 大 
利 语 西班牙 语 、 葡 萄 牙 语 、 荷 兰 语 波兰 语 汉语、 日 语 、 韩 国语 、 瑞 典 语 、 和 希腊 语 以 及 阿拉 
伯 15 种 语言 中 20 对 语言 之 间 的 相互 翻译 。 系 统 针 对 不 同 的 用 户 和 不 同 的 应 用 场景 分 成 
不 同 的 版 本 。 它 不 但 给 Yahoo!、AltaVista 等 大 型 搜寻 引擎 (包括 Google) 提 供 翻 译 技 
术 , 也 继续 为 美国 空军 及 欧盟 委员 会 提供 翻译 服务 。 

2. 其 他 基于 规则 的 翻译 系统 

除 SYSTRAN 外 , 另 一 个 实用 翻译 系统 Meteo 的 成 功 开发 在 机 器 翻译 史上 也 具有 重 
要 意义 ,该 系统 在 1976 年 安装 使 用 至 今 , 不 断 升 级 ,并 一 直 稳 定 地 提供 服务 。 

Meétéo 系统 是 由 加 拿 大 蒙特 利 尔 大 学 自动 翻译 组 (TAUM) 于 1975 年 开发 的 ,1977 
年 正式 投入 使 用 ,成 为 历史 上 首 个 对 公众 服务 的 机 器 翻译 系统 。1989 年 ,Meteo 系统 又 
扩充 了 法 英 翻译 服务 。 作 为 一 个 实用 系统 ,Meteo 可 以 高 质量 地 提供 翻译 服务 ,Meteo 在 
理论 方面 的 贡献 是 它 展 示 了 子 语言 的 开发 策略 是 可 以 非常 成 功 的 。 

其 他 实用 系统 包括 德国 Saarland 大 学 开发 的 SUSY 系统 、 法 国 Grenoble 大 学 开发 
的 GETA 及 在 此 基础 上 改进 后 形成 的 Ariane、 西 门 子 公司 开发 的 商品 化 机 器 翻译 系统 
METAL、Logos 公司 开发 的 Logos 智能 翻译 系统 、 富 士 通 公司 开发 的 ATLAS 系统 、 中 国 
中 软 公司 的 译 星 - 工 号 机 器 翻译 系统 等 。 

3. 辅助 翻译 系统 及 Trados 

全 自动 翻译 技术 很 难 被 专业 翻译 人 员 所 接受 ,以 提高 翻译 人 员 翻 译 效率 为 目标 的 机 
器 辅助 翻译 技术 应 运 而 生 。 

在 辅助 翻译 系统 开发 方面 起 步 较 早 且 较 成 功 的 公司 是 成 立 于 1984 年 的 德国 Trados 
公司 ,该 公司 在 20 世纪 90 年 代 初 期 分 别 发 布 了 服务 于 翻译 人 员 的 术语 管理 工具 
MutiTerm 以 及 以 翻译 记忆 技术 为 核心 的 译员 工作 站 (translator's workbench) 。 翻 译 记 
忆 技 术 和 术语 翻译 的 一 致 化 处 理 在 本 地 化 (localization) 翻译 服务 中 优势 明显 。 到 20 世 
纪 90 年 代 末 期 ,Trados 公司 已 经 成 为 桌面 式 翻 译 记忆 技术 的 主要 提供 商 。 除 Trados 公 
司 外 ,英国 SDL 公司 的 SDL 系统 西班牙 ATRIL 公司 的 Déja Vu 系 统 、 瑞 士 STAR 公司 
的 Transit 系统 也 都 是 辅助 翻译 技术 的 代表 性 系统 。2005 年 ,Trados 公司 被 SDL 公司 收 
购 ,Trados 系统 更 名 为 SDL-Trados。 作 为 语言 技术 提供 商 ,SDL 公司 2008 年 的 收入 达 
到 了 1. 58 亿 英 镑 。 
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4. 国内 机 器 翻译 系统 

20 世纪 80 年 代 , 军 事 科 学 院 研制 的 “KY-1” 英 汉 机 译 系统 获得 了 国家 科技 进步 二 等 
奖 ,后 来 成 为 世界 上 第 一 个 商品 化 英汉 机 器 翻译 系统 “ 译 星 ”(1988, 中 软 公司 )。 中 科 院 计 
算 所 研制 的 智能 型 英汉 机 译 系统 于 1995 年 获得 了 国家 科技 进步 一 等 奖 。 

其 他 商品 化 机 器 翻译 系统 包括 “ 赛 迪 ”高 立 ” 天 津 通 译 , 金 山 快 译 等 。 在 机 器 辅助 翻 
译 系统 构建 方面 的 代表 性 系统 是 雅信 CAT 系统 。 

1992 年 ,中科院 计算 所 和 香港 权 智 公 司 推出 了 世界 上 第 一 个 带 整 句 翻译 功能 的 电子 
词典 “ 快 译 通 EC-863A”, 后 来 以 此 为 基础 成 立 了 “ 华 建 " 机 器 翻译 有 限 公 司 。 其 系统 采用 
的 主体 方法 是 基于 规则 的 方法 ,目前 支持 的 语种 包括 汉语 、 英 语 、 俄 语 .日 语 、 德 语法 语 、 
西班牙 语 7 种 语言 ,基本 上 实现 了 汉语 与 这 些 语言 之 间 的 互相 翻译 。 

1999 年 ,看 世界 公司 推出 史 晓 东 博 士 开发 的 世界 上 第 一 个 具有 网 页 实时 翻译 功能 的 
网 站 www. readworld. com, 引 起 了 相当 大 的 关注 。 

沈阳 格 微 公 司 采用 计算 机 辅助 翻译 技术 建立 的 “ 格 微 协同 翻译 平台 ”在 2 亿 汉 字 的 百 
万 专利 翻译 工程 实践 中 取得 显著 的 应 用 效果 。 国 家 知识 产权 局 信息 中 心 也 推出 了 基于 机 
器 翻译 技术 的 中 国 专利 检索 工具 。 中 国 科 学 院 计算 技术 研究 所 和 东方 灵 盾 公司 合作 ,将 
统计 机 器 翻译 技术 应 用 于 专利 翻译 技术 ,开发 了 一 个 专利 机 器 翻译 系统 “ 专 译 家 ”。 

5. 统计 机 器 翻译 系统 

20 世纪 90 年 代 起 ,机 器 翻译 方法 出 现 了 多 样 化 趋势 ,一 个 令 人 瞩目 的 变化 是 统计 机 
器 翻译 方法 重 回 研究 人 员 的 视野 。2002 年 ,第 一 个 采用 统计 机 器 翻译 方法 的 商业 公司 
Language Weaver 成 立 。2004 年 ,Och 进入 Google 公司 ,开始 为 Google 公司 构建 实用 机 
器 翻译 系统 。 

在 Och 进入 Google 公司 前 ,与 其 他 主要 搜索 引擎 公司 相同 ,Google 在 为 其 搜索 引擎 
提供 翻译 服务 时 使 用 的 也 是 SYSTRAN 系统 。 但 在 Och 进入 公司 后 ,这 种 局 面 就 发 生 了 
很 大 的 改变 ,2005 年 在 美国 NIST 组 织 的 阿拉 伯 语 -英语 ,汉语 -英语 机 器 翻译 评测 工作 
中 ,Google 公司 取得 了 所 有 评测 项 目的 第 一 名 ,其 评测 成 绩 甚 至 远 远 超过 SYSTRAN 系 
统 。 实 用 的 机 器 翻译 系统 不 再 单纯 是 基于 规则 的 系统 ,基于 统计 的 机 器 翻译 方法 同样 可 
以 开发 出 实用 的 翻译 系统 。 在 开发 速度 以 及 译文 质量 方面 ,基于 统计 的 机 器 翻译 方法 甚 
至 更 具 优 势 。 

2007 年 ,Google 公司 在 其 搜索 引擎 中 开始 使 用 自己 的 翻译 技术 提供 服务 ,任何 用 户 
都 可 以 很 方便 地 使 用 Google 公司 的 机 器 翻译 服务 。2009 年 ,Google 公司 甚至 发 布 了 
Google Translate API。 利 用 API, 人 们 可 以 很 容易 地 为 各 自 的 网 站 添加 翻译 服务 。 
Google Translate 代表 了 当时 实用 的 统计 机 器 翻译 系统 的 最 高 水 平 。 

根据 英国 著名 机 器 翻译 评论 家 John Hutchins 的 持续 跟踪 性 统计 ,目前 世界 上 已 知 
的 翻译 产品 已 达 四 百 余 种 , 数 百 个 公司 和 机 构 从 事 翻译 产品 的 开发 和 销售 , 据 粗略 统计 ， 
涉及 的 语种 达 60 余 种 。 机 器 翻译 系统 的 形式 也 日 趋 多 样 化 ,不 仅 有 面向 个 人 使 用 的 翻译 
产品 ,也 有 面向 企业 用 户 的 翻译 产品 ;不 仅 有 单机 运行 的 系统 ,更 有 工作 在 因特网 上 的 
Client/Server 结构 的 系统 ;很 多 产品 还 提供 了 基于 互联 网 的 在 线 翻 译 服 务 。 翻 译 系统 也 
日 益 出 现在 手机 、PDA 和 电子 词典 产品 中 ,以 嵌入 式 系统 的 方式 提供 服务 。 从 目前 的 情 
况 看 ,翻译 产品 中 使 用 的 自动 翻译 技术 仍 以 规则 方法 为 主 ,但 Google Translate 的 出 现 意 
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味 着 这 一 局 面 已 被 打破 ,未 来 出 现 更 多 的 实用 统计 翻译 系统 也 不 是 不 可 能 的 事情 。 

如 今 功能 较 强 方便 易 用 的 在 线 翻 译 工 具有 谷歌 翻译 、 必 应 翻译 、 脸 谱 翻 译 、 宝 贝 鱼 翻 
译 ` 巴 比 伦 翻 译 等 ,其 中 后 起 之 秀 的 谷歌 翻译 (google translate) 最 具 特 色 , 同 时 最 具 代 
表 性 。 

谷歌 翻译 目前 可 提供 63 种 主要 语言 之 间 的 实时 翻译 , 它 可 以 提供 所 支持 的 任意 两 种 
语言 之 间 的 互 译 ,包括 字 词 ,句子 .文本 和 网 页 翻译 。 另 外 , 它 还 可 以 帮助 用 户 阅 读 搜索 结 
果 、 网 页 .电子 邮件 YouTube 视频 字幕 以 及 其 他 信息 ,用 户 甚 至 还 能 在 Gmail 内 进行 实 
时 的 多 语言 对 话 。 

谷歌 翻译 主要 是 采用 统计 翻译 模型 , 往 计算 器 内 输入 大 量 的 文字 文本 ,包括 源 语言 
文本 ,以 及 对 应 目标 语言 人 工 翻 译 的 文本 ,通过 海量 统计 数据 提高 翻译 精确 度 。 

之 所 以 采用 统计 翻译 模型 ,一 个 重要 原因 是 ,谷歌 翻译 采用 了 云 计算 架构 。 该 架构 拥 
有 谷歌 研发 的 分 布 式 计算 系统 (MapReduce) 和 分 布 式 存储 系统 (BigTable); 这 两 个 系统 
很 有 创造 性 ,而且 有 极 大 的 扩展 性 ,使 得 谷歌 在 系统 吞吐 量 上 有 很 大 的 竞争 力 。 

机 译 更 激动 人 心 的 应 用 在 于 日 常 对 话 中 的 实时 翻译 。 这 一 领域 同样 是 谷歌 领先 ; 它 
拥有 较 强 的 语音 识别 技术 ,可 以 通过 声音 实现 自动 检索 ,再 将 语音 识别 和 机 译 结合 在 
一 起 。 

2011 年 11 月 ,谷歌 最 新 推出 了 一 款 手机 翻译 软件 ;该 软件 支持 包括 汉语 普通 话 在 内 
的 14 个 语种 。 对 着 谷歌 Android 智能 手机 讲话 的 用 户 ,几乎 能 实时 听 到 他 们 的 源 语言 被 
翻译 成 目标 语言 ;而 通话 对 方 的 语言 也 会 被 翻译 成 该 用 户 的 母语 。 


8.7.2 机 器 翻译 的 基本 模式 和 方法 


从 形式 上 看 ,机 器 翻译 过 程 就 是 由 一 个 符号 序列 变换 为 另 一 个 符号 序列 的 过 程 。 这 
种 变换 有 3 种 基本 模式 (图 8-8) 。 


中 间 语言 






短语 转换 





直译 式 





源 语言 


目标 语言 


图 8-8 机 器 翻译 的 金字 塔 


(1) 直译 式 (一 步 式 )。 直 接 将 特定 的 源 语言 翻译 成 目标 语言 ,翻译 过 程 主要 表现 为 
源 语言 单元 (主要 是 词 ) 向 目标 语言 单元 的 替换 ,对 语言 的 分 析 很 少 。 

(2) 中 间 语 言 式 ( 二 步 式 )。 先 分 析 源 语言 ,并 将 其 变换 为 某 种 中 间 语 言 形式 ,然后 再 
从 中 间 语 言 出 发 ,生成 目标 语言 。 

(3) 转换 式 (三 步 式 )。 先 分 析 源 语言 ,形成 某 种 形式 的 内 部 表示 (如 句法 结构 形式 )， 
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然后 将 源 语言 的 内 部 表示 转换 为 目标 语言 对 应 的 内 部 表示 ,最 后 从 目标 语言 的 内 部 表示 
再 生成 目标 语言 。 

3 种 模式 构成 了 机 器 翻译 的 金字 塔 。 塔 底 对 应 于 直译 式 , 塔 顶 对 应 于 中 间 语 言 式 ,为 
翻译 的 两 个 极端 ;中 间 不 同 层次 统称 为 转换 式 。 金 字 塔 最 下 层 的 直译 式 主要 是 基于 词 的 
翻译 。 在 塔 中 ,每 上 升 一 层 , 其 分 析 更 深 一 层 ,向 “理解 "更 允 近 一 步 ,理论 上 ,翻译 的 质量 
也 更 进 一 层 ;但 另 一 方面 , 越 往 上 双 近 ,处 理 的 难度 和 复杂 度 也 越 大 ,出 错 以 及 错误 传播 的 
机 会 也 随 之 增加 ,这 反而 可 能 影响 翻译 质量 。 

机 器 翻译 本 质 上 是 一 项 智能 活动 ,无 论 是 源 语言 的 分 析 、 目 标语 言 的 生成 ,还 是 源 语 
言 与 目标 语言 的 内 部 形式 转换 ,都 需要 复杂 的 推理 。 这 一 方面 需要 大 量 的 知识 储备 (包括 
语言 相关 和 语言 之 外 的 世界 知识 ) ,同时 ,还 要 有 运用 知识 进行 推理 的 能 力 。 根 据 知 识 获 
取 方 式 的 不 同 ,可 以 将 机 器 翻译 分 成 基于 人 工 知识 的 机 器 翻译 和 基于 学 习 的 机 器 翻译 方 
法 ;根据 学 习 方 法 的 不 同 ,又 可 以 将 机 器 翻译 分 为 非 参 数 方法 (或 实例 方法 ) 与 参数 方法 
(或 统计 方法 )。 下 面 简 要 介绍 这 3 种 方法 以 及 近 几 年 兴起 的 神经 网 络 方法 。 

1. 基于 人 工 规 则 的 方法 

机 器 翻译 的 最 典型 方法 就 是 将 人 类 翻译 的 知识 总 结 .抽象 出 来 ,以 特定 的 形式 存 人 计 
算 机 。 在 翻译 过 程 中 ,计算 机 结合 待 翻译 的 输入 ,选择 相应 的 知识 进行 推理 或 变换 。 最 典 
型 的 知识 表示 形式 是 规则 ,因此 ,基于 规则 的 机 器 翻译 (Rule Based Machine Translation， 
RBMT) 也 成 为 这 类 方法 的 代表 。 翻 译 规则 包括 源 语言 的 分 析 规则 、 源 语言 的 内 部 表示 向 
目标 语言 内 部 表示 的 转换 规则 以 及 目标 语言 的 内 部 表示 生成 目标 语言 的 规则 。 规 则 是 高 
度 抽 象 的 ,具有 很 强 的 覆盖 性 。 但 提炼 规则 并 不 是 一 件 容易 的 事情 ,提炼 出 来 的 规则 也 难 

2. 基于 实例 的 方法 

基于 实例 的 方法 与 机 器 学 习 中 的 基于 实例 的 学 习 (Instance Based Learning,IBL) 或 
基于 案例 的 学 习 (Case Based Reasoning,CBR ) 的 思想 类 似 , 就 是 从 实例 库 中 寻找 与 待 翻 
译 的 源 语言 单元 (通常 是 句子 ) 最 相似 的 例子 ,再 对 相应 的 目标 语言 单元 进行 调整 。 

最 早 提出 这 一 思想 的 是 Martin Kay。 他 在 1980 年 提出 借助 于 已 有 的 翻译 实例 进行 
辅助 翻译 的 观点 ,这 一 思想 目前 称 为 翻译 记忆 (TM)。Martin Kay 不 相信 全 自动 的 机 器 
翻译 ,但 认为 可 以 借助 TM 进行 机 助人 译 (或 人 助 机 译 ), 即 从 记忆 单元 中 查找 与 源 语言 
最 相似 的 一 个 或 K 个 例子 ,将 相应 的 目标 语言 交 给 用 户 选择 和 修改 ,由 用 户 确 定 译文 。 
TM 有 很 多 应 用 ,如 产品 升级 换代 后 的 说 明 书 和 相关 文档 的 翻译 。 新 的 文档 与 先前 版 本 
的 文档 保持 相当 内 容 的 一 致 ,在 翻译 时 可 以 直接 借用 。 

与 此 类 似 ,Nagao 也 于 1984 年 提出 了 基于 实例 的 翻译 方法 (EBMT)。 但 与 TM 不 一 
样 ,EBMT 服务 于 全 自动 翻译 。 由 于 待 翻译 的 源 语言 并 不 一 定 有 完全 相同 的 实例 ,因此 
在 全 自动 翻译 中 就 必定 要 对 检索 到 的 实例 的 译文 进行 变换 或 重组 。 

3. 基于 统计 模型 的 方法 

基于 统计 模型 的 方法 (或 称 为 统计 机 器 翻译 ) 是 一 种 参数 学 习 方 法 。 基 于 实例 的 非 参 
数 方法 总 是 需要 保存 翻译 实例 (或 泛 化 后 的 模板 ) 用 作 实际 的 翻译 ,统计 翻译 模型 则 是 利 
用 实例 训练 模型 参数 ,以 参数 服务 于 机 器 翻译 。 用 P(EIF) 描 述 将 源 文 下 翻译 成 译文 羽 
的 概率 ,这 些 概 率 满足 归 一 化 条 件 , 即 P(E|F) 二 1。 
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统计 机 器 翻译 问题 可 以 分 解 为 3 个 基本 问题 。 

(1) 建 模 。 对 P(E|F) 进 行 定义 ,给 出 其 数学 描述 。 这 是 统计 机 器 翻译 的 核心 问题 。 

(2) 训练 (学 习 ) 。 利 用 双语 语 料 训练 P(EIF) 的 参数 。 

(3) 解码 (推理 )。 对 于 给 定 的 句子 下 ,在 译文 空间 中 ,搜索 使 概率 P(EIF) 最 大 的 句 
子 EE。 

由 于 统计 机 器 翻译 本 质 上 是 带 参 数 的 机 器 学 习 , 与 语言 本 身 没 有 关系 ,因此 ,模型 适 
用 于 任意 语言 对 ,也 方便 迁移 到 不 同 应 用 领域 。 翻 译 知识 都 通过 相同 的 训练 方式 对 模型 
参数 化 ,翻译 也 用 相同 的 解码 算法 推理 实现 。 

随 着 互联 网 文本 数据 的 持续 增长 和 计算 机 运算 能 力 的 不 断 增强 ,数据 驱动 的 统计 方 
法 从 20 世纪 90 年 代 起 开始 逐渐 成 为 机 器 翻译 的 主流 技术 。 统 计 机 器 翻译 为 自然 语言 翻 
译 过 程 建立 概率 模型 并 利用 大 规模 平行 语料库 训练 模型 参数 ,具有 人 工 成 本 低 、 开 发 周期 
短 的 优点 ,克服 了 传统 理性 主义 方法 面临 的 翻译 知识 获取 瓶颈 问题 ,因而 成 为 Google、 微 
软 、 百 度 、 有 道 等 国内 外 公司 在 线 机 器 翻译 系统 的 核心 技术 。 

尽管 如 此 ,统计 机 器 翻译 仍然 在 以 下 6 个 方面 面临 严峻 挑战 。 

(1) 线性 不 可 分 : 统计 机 器 翻译 主要 采用 线性 模型 ,处 理 高 维 复杂 语言 数据 时 线性 
不 可 分 的 情况 非常 严重 ,导致 训练 和 搜索 算法 难以 通 近 译文 空间 的 理论 上 界 。 

(2) 缺乏 合适 的 语义 表示 : 统计 机 器 翻译 主要 在 词汇 、 短 语 和 句法 层面 实现 源 语言 
文本 到 目标 语言 文本 的 转换 ,缺乏 表达 能 力 强 、 可 计算 性 高 的 语义 表示 支持 机 器 翻译 实现 
语义 层面 的 等 价 转换 。 

(3) 难以 设计 特征 : 统计 机 器 翻译 依赖 人 类 专家 通过 特征 表示 各 种 翻译 知识 源 。 由 
于 语言 之 间 的 结构 转换 非常 复杂 ,人 工 设 计 特征 难以 保证 覆盖 所 有 的 语言 现象 。 

(4) 难以 充分 利用 非 局 部 上 下 文 : 统计 机 器 翻译 主要 利用 上 下 文 无 关 的 特性 设计 高 
效 的 动态 规划 搜索 算法 ,导致 难以 有 效 将 非 局 部 上 下 文 信息 容纳 在 模型 中 。 

(5) 数据 稀 朴 : 统计 机 器 翻译 中 的 翻译 规则 (双语 短语 或 同步 文法 规则 ) 结 构 复杂 ， 
即便 是 使 用 大 规模 训练 数据 ,仍然 面临 着 严重 的 数据 稀 朴 问题 。 

(6) 错误 传播 : 统计 机 器 翻译 系统 通常 采用 流水 线 架构 , 即 先进 行 词法 分 析 和 句法 
分 析 , 再 进行 词语 对 齐 , 最 后 抽取 规则 。 每 一 个 环节 出 现 的 错误 都 会 放大 传播 到 后 续 环 
节 , 严 重 影响 了 翻译 性 能 。 

4. 基于 神经 网 络 的 方法 

由 于 深度 学 习 能 够 较 好 地 缓解 统计 机 器 翻译 面临 的 上 述 挑战 ,基于 深度 学 习 的 方法 
自 2013 年 后 获得 迅速 发 展 ,成 为 当前 机 器 翻译 领域 的 研究 热点 。 基 于 深度 学 习 的 机 器 翻 
译 大 致 可 分 为 两 种 方法 。 

(1) 利用 深度 学 习 改 进 统 计 机 器 翻译 : 仍 以 统计 机 器 翻译 为 主体 框架 ,利用 深度 学 
习 改 进 其 中 的 关键 模块 。 

(2) 端 到 端 神 经 机 器 翻译 : 一 种 全 新 的 方法 体系 ,直接 利用 神经 网 络 实现 源 语言 文 
本 到 目标 语言 文本 的 映射 。 

神经 网 络 机 器 翻译 最 近 3 年 取得 了 很 好 的 进展 。 微 软 亚洲 研究 院 常 务 副 院 长 周明 介 
绍 ,NMT( 神 经 网 络 机 器 翻译 ) 与 经 典 的 SMT( 统 计 机 器 翻译 ) 相 比 ,BLEU 值 至 少 提升 了 
4 个 点 (BLEU 是 衡量 机 器 翻译 结果 的 一 个 常用 指标 )。 这 是 一 个 很 大 的 进步 。 要 知道 统 
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计 机 器 翻译 在 过 去 5 年 里 都 没有 这 么 大 的 提升 。NMT 已 被 公认 为 机 器 翻译 的 主流 技 
术 , 许 多 公司 都 已 经 大 规模 采用 NMT 作为 上 线 的 系统 。 
最 近 也 有 学 者 在 考虑 把 一 些 知 识 加 入 到 系统 中 。 例 如 ,在 源 语言 编码 时 考虑 源 语言 
的 句法 树 ( 词 汇 之 间 的 句法 关系 ) ,或 者 在 解码 时 考虑 目标 语言 的 句法 树 的 信息 。 通 过 句 
法 树 加 强 对 目标 语 的 词汇 的 预测 能 力 。 微 软 亚 洲 研究 院 用 领域 知识 图 谱 强化 编码 和 解 
码 , 得 到 了 很 好 的 结果 。 


8.7.3 统计 机 器 翻译 


1. 基于 词 的 统计 机 器 翻译 模型 

IBM 最 早 提出 的 5 个 翻译 模型 就 是 基于 词 的 模型 ,其 基本 思想 是 : 对 于 给 定 的 大 
规模 句子 对 齐 的 语料库 ,通过 词语 共 现 关系 确定 双语 的 词语 对 齐 ; 四 一 旦 得 到 了 大 规模 
语料库 上 的 词语 对 齐 关系 ,就 可 以 得 到 一 张 带 概率 的 翻译 词典 ; 加 通过 词语 翻译 概率 和 
一 些 简单 的 词语 调 序 概率 ,计算 两 个 句子 互 为 翻译 的 概率 。 

这 里 有 一 个 重要 的 概念 , 即 双语 的 词语 对 齐 。 图 8-9 汉 英 词语 对 齐 示 意图 。 
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图 8-9 英汉 词语 对 齐 示意 图 


IBM 模型 通过 一 种 很 巧妙 的 方法 ,可 以 利用 给 定 的 大 规模 语料库 中 的 词语 共 现 关 
系 ,自动 计算 出 句子 之 间 词 语 对 齐 的 关系 ,而 不 需要 利用 任何 外 部 知识 (如 词典 .规则 等 )， 
同时 可 以 达到 较 高 的 准确 率 , 这 比 单纯 使 用 词典 的 方法 正确 率 要 高 得 多 。 其 实 , 这 种 方法 
的 原理 也 很 简单 ,就 是 利用 词语 之 间 的 共 现 关系 。 比 如 说 ,知道 以 下 两 个 句子 对 是 互 为 翻 
译 的 : 

A B< -一 X 了 

A C=- 一 XZ 

根据 直觉 ,很 容易 猜想 A 翻译 成 X,B 翻译 成 Y,C 翻译 成 Z。 只 是 当 有 成 千 上 万 的 
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句子 对 ,每 个 句子 都 有 几 十 个 词 的 时 候 , 依 靠 人 的 直觉 就 不 够 了 。IBM 模型 将 人 的 这 种 
直觉 用 数学 公式 定义 出 来 ,并 给 出 了 具体 的 实现 算法 ,这 种 算法 称 为 EM 训练 算法 。 

通过 IBM 模型 的 训练 ,可 以 利用 一 个 大 规模 双语 语料库 得 到 一 部 带 概 率 的 翻译 词 
典 。 同 时 ,IBM 模型 也 对 词语 调 序 建立 了 模型 ,但 这 种 模型 是 完全 不 考虑 结构 的 ,因此 对 
词语 调 序 的 刻画 能 力 很 弱 。 例 如 , 它 可 以 判断 出 两 个 源 语言 中 相 邻 的 词语 翻译 后 依然 相 
邻 的 概率 较 高 ,如 此 而 已 。 在 基于 词 的 翻译 方法 中 ,对 词语 调 序 起 主要 作用 的 还 是 语言 
模型 。 

在 基于 词 的 统计 翻译 模型 下 ,解码 的 过 程 通常 可 以 理解 为 一 个 搜索 的 过 程 ,或 者 说 ， 
理解 成 一 个 不 断 猜测 的 过 程 。 这 个 过 程 大 致 如 下 。 

第 一 步 , 猜 测 译文 的 第 一 个 词 是 源 文 的 哪 一 个 词 翻 译 过 来 的 ;第 二 步 ,猜测 译文 的 第 
二 个 词 应 该 是 什么 ;第 三 步 ,猜测 译文 的 第 二 个 词 是 源 文 的 哪 一 个 词 翻译 过 来 的 ;以 此 类 
推 ,直到 所 有 源 文 词语 都 被 翻译 完 。 

在 解码 的 过 程 中 ,要 反复 使 用 翻译 模型 和 语言 模型 计算 各 种 可 能 的 候选 译文 的 概率 ， 
以 避免 搜索 的 范围 过 大 。 

IBM 模型 可 以 较 好 地 刻画 词语 之 间 的 翻译 概率 ,但 由 于 没有 采用 任何 句法 结构 和 上 
下 文 信息 , 它 对 词语 调 序 能 力 的 刻画 是 非常 弱 的 。 而 且 由 于 词语 翻译 的 时 候 没有 考虑 上 
下 文 词语 的 搭配 ,也 经 常会 导致 词语 翻译 的 错误 。 

尽管 作为 一 种 基于 词 的 翻译 模型 ,IBM 模型 的 性 能 已 经 被 新 型 的 翻译 模型 超越 ,但 
作为 一 种 大 规模 词语 对 齐 的 工具 ,IBM 模型 仍然 在 统计 机 器 翻译 研究 中 广泛 使 用 ,而 且 
几乎 是 不 可 或 缺 的 。 

2. 基于 短语 的 统计 机 器 翻译 

经 过 努力 ,基于 短语 的 统计 翻译 模型 目前 已 经 趋 于 成 熟 ,其 性 能 已 经 远 远 超过 基于 词 
的 统计 翻译 模型 ( 即 IBM 模型 )。 这 种 模型 是 建立 在 词语 对 齐 的 语料库 的 基础 上 的 ,其 中 
词语 对 齐 的 工作 仍然 要 依靠 IBM 模型 实现 。 但 这 种 模型 对 于 词语 对 齐 是 非常 鲁 棒 的 , 即 
使 词语 对 齐 的 效果 不 太 好 ,依然 可 以 取得 很 好 的 性 能 。 

基于 短语 的 翻译 模型 原理 是 在 词语 对 齐 的 语料库 上 ,寻找 并 记录 所 有 的 互 为 翻译 的 
双语 短语 ,并 在 整个 语料库 上 统计 这 种 双语 短语 的 概率 。 

假设 已 经 得 到 如 下 的 两 个 词语 对 齐 的 片段 (图 8-10)。 





[是 不 能 | [忘记 | [的 


[ Was not to be forgotten 


图 8-10 汉 英 片断 对 齐 
























































解码 (翻译 ) 的 时 候 , 只 将 被 翻译 的 句子 与 短语 库 中 的 源 语言 短语 进行 匹配 , 找 出 概率 
最 大 的 短语 组 合 ,并 适当 调整 目标 短语 的 语序 即 可 。 

这 种 方法 几乎 就 是 一 种 机 械 的 死记 硬 背 式 的 方法 。 基 于 短语 的 统计 翻译 模型 的 性 能 
远 远 超过 已 有 的 基于 实例 的 机 器 翻译 系统 。 
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8.7.4 利用 深度 学 习 改 进 统 计 机 器 翻译 


利用 深度 学 习 改 进 统计 机 器 翻译 的 核心 思想 是 以 统计 机 器 翻译 为 主体 ,使 用 深度 学 
习 改 进 其 中 的 关键 模块 ,如 语言 模型 .翻译 模型 . 调 序 模型 .词语 对 齐 等 。 

深度 学 习 能 够 帮助 机 器 翻译 缓解 数据 稀 朴 问题 。 以 语言 模型 为 例 。 语 言 模型 能 够 量 
化 译文 的 流利 度 , 对 译文 的 质量 产生 直接 的 重要 影响 ,是 机 器 翻译 中 的 核心 模块 。 传 统 的 
语言 模型 采用 n-gram 方法 ,通过 极 大 似 然 估计 训练 模型 参数 。 由 于 这 种 方法 采用 离散 表 
示 ( 即 每 个 词 都 是 独立 的 符号 ), 极 大 似 然 估 计 面 临 着 严重 的 数据 稀 朴 问题 : 大 多 数 
n-gram 在 语料库 上 只 出 现 一 次 ,无 法 准确 估计 模型 参数 。 因 此 ,传统 方法 不 得 不 使 用 平 
滑 和 回 退 等 策略 缓解 数据 稀 朴 问题 。 但 即使 采用 平滑 和 回 退 策略 ,统计 机 器 翻译 系统 还 
是 因为 数据 过 于 稀 玻 而 无 法 捕获 更 多 的 历史 信息 ,通常 仅 能 使 用 4-gram 或 者 5-gram 语 
言 模型 。 

深度 学 习 著名 学 者 .加拿大 蒙特 利 尔 大 学 Yoshua Bengio 教授 在 2003 年 率先 提出 
基于 神经 网 络 的 语言 模型 ,通过 分 布 式 表示 ( 即 每 个 词 都 是 连续 、 稠 密 的 实数 向 量 ) 有 
效 缓解 了 数据 稀 朴 问题 。 美 国 BBN 公司 的 Jacob Devlin 等 人 于 2014 年 进一步 提出 神 
经 网 络 联合 模型 (neural network joint models) 。 传 统 的 语言 模型 往往 只 考虑 目标 语言 
端的 前 n 一 1 个 词 。 以 图 8-11 为 例 , 假 设 当 前 词 是 the, 一 个 4-gram 语言 模型 只 考虑 之 
前 的 3 个 词 : get、will 和 i。Jacob Devlin 等 人 认为 ,不 仅 是 目标 语言 端的 历史 信息 对 于 
决定 当前 词 十 分 重要 , 源 语言 端的 相关 部 分 也 起 着 关键 作用 。 因 此 ,其 神经 网 络 联合 
模型 额外 考虑 5 个 源 语 言词 . 即 * 就 “* 取 ”“ 钱 “给 ”和 “了 ”。 由 于 使 用 分 布 式 表示 能 够 
缓解 数据 稀疏 问题 ,神经 网 络 联合 模型 能 够 使 用 丰富 的 上 下 文 信息 (图 8-11 共 使 用 了 
8 个 词 作为 历史 信息 ), 从 而 相对 于 传统 的 统计 机 器 翻译 方法 获得 了 显著 提升 (BLEU 
值 提高 约 6 个 百分点 ) 。 


S 我 地 们 
i will get money to perf. them 
= | 


3 
P(the |get, will, i, 就 ， 取 ， 钱 ， 给 , 了) 
图 8-11 神经 网 络 联合 模型 


















money to them 


对 机 器 翻译 而 言 , 使 用 神经 网 络 的 另 一 个 优点 是 能 够 解决 特征 难以 设计 的 问题 。 以 
调 序 模型 为 例 , 基 于 反 向 转录 文法 的 调 序 模型 是 基于 短语 的 统计 机 器 翻译 的 重要 调 序 方 
法 之 一 ,其 基本 思想 是 将 调 序 视 作 二 元 分 类 问题 : 将 两 个 相 邻 源 语 言词 串 的 译文 顺序 拼 
接 或 逆序 拼接 。 传 统 方法 通常 使 用 最 大 炉 分 类 器 ,但 是 如 何 设计 能 够 捕获 调 序 规律 的 特 
征 成 为 难点 。 由 于 词 串 的 长 度 往往 非常 长 ,如 何 从 众多 的 词语 集合 中 选 出 能 够 对 调 序 决 
策 起 关键 作用 的 词语 是 非常 困难 的 。 因 此 ,基于 反 向 转录 文法 的 调 序 模型 不 得 不 仅 基 于 
词 串 的 边界 词 设计 特征 ,无 法 充分 利用 整个 词 串 的 信息 。 利 用 神经 网 络 能 够 缓解 特征 设 
计 的 问题 ,首先 利用 递归 自动 编码 器 (recursive autoencoders) 生 成 词 串 的 分 布 式 表示 ; 然 
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后 基于 4 个 词 串 的 分 布 式 表示 建立 神经 网 络 分 类 器 。 因 此 ,基于 神经 网 络 的 调 序 模型 不 
需要 人 工 设计 特征 ,就 能 够 利用 整个 词 串 的 信息 ,显著 提高 了 调 序 分 类 准确 率 和 翻译 质 
量 。 实 际 上 ,深度 学 习 不 仅 能 够 为 机 器 翻译 生成 新 的 特征 ,还 能 够 将 现 有 的 特征 集合 转化 
成 新 的 特征 集合 ,显著 提升 了 翻译 模型 的 表达 能 力 。 

尽管 利用 深度 学 习 改进 统计 机 器 翻译 取得 了 显著 的 效果 ,但 仍然 面临 以 下 难题 : 
中 线性 不 可 分 一 一 整体 框架 仍 是 线性 模型 ,高 维 数据 线性 不 可 分 的 情况 依然 存在 ; @@ 非 
局 部 特征 一 一 通过 深度 学 习 引 入 的 新 特征 往往 是 非 局 部 的 ,导致 无 法 设计 高 效 的 动态 规 
划算 法 ,从 而 不 得 不 采用 在 后 处 理 阶段 进行 超 图 重 排序 等 近似 技术 。 


8.7.5 端 到 端 神经 机 器 翻译 


端 到 端 神经 机 器 翻译 (end-to-end neural machine translation) 是 从 2013 年 兴起 的 一 
种 全 新 机 器 翻译 方法 ,其 基本 思想 是 使 用 神经 网 络 直接 将 源 语言 文本 映射 成 目标 语言 文 
本 。 与 统计 机 器 翻译 不 同 , 不 再 有 人 工 设 计 的 词语 对 齐 、 短 语 切 分 、 句 法 树 等 隐 结 构 ,不 再 
需要 人 工 设计 特 征 , 端 到 端 神经 机 器 翻译 仅 使 用 一 个 非 线 性 的 神经 网 络 便 能 直接 实现 自 
然 语言 文本 的 转换 。 

英国 牛津 大 学 的 Nal Kalchbrenner 和 Phil Blunsom 于 2013 年 首先 提出 了 端 到 端 神 
经 机 器 翻译 。 他 们 为 机 器 翻译 提出 一 个 “编码 -解码 ”的 新 框架 : 给 定 一 个 源 语言 句子 , 首 
先 使 用 一 个 编码 器 将 其 映射 为 一 个 连续 、 稠 密 的 向 量 , 然 后 再 使 用 一 个 解码 器 将 该 向 量 转 
化 为 一 个 目标 语言 句子。 他 们 使 用 的 编码 器 是 卷 积 神经 网 络 , 解 码 器 是 递归 神经 网 络 。 
使 用 递归 神经 网 络 具有 能 够 捕获 全 部 历史 信息 和 处 理 变 长 字符 串 的 优点 。 

美国 Google 公司 的 Ilya Sutskever 等 人 于 2014 年 将 长 短期 记忆 (Long ShortrTerm 
Memory,LSTM) 引 入 端 到 端 神经 机 器 翻译 。LSTM 通过 采用 设置 门 开关 (gate) 的 方法 
解决 了 训练 递归 神经 网 络 时 的 “梯度 消失 ”和 “梯度 爆炸 ”问题 ,能 够 较 好 地 捕获 长 距离 
依赖 。 

具体 来 讲 , 一 个 句子 首先 经 过 一 个 LSTM 实现 编码 ,得 到 N 个 隐 状 态 序 列 。 每 一 个 
隐 状 态 代 表 从 句 首 到 当前 词汇 为 止 的 信息 的 编码 。 句 子 最 后 的 隐 含 状态 可 以 看 作 是 全 句 
信息 的 编码 。 然 后 再 通过 一 个 LSTM 进行 解码 。 逐 词 进行 解码 。 在 某 一 个 时 刻 ,有 3 个 
信息 起 作用 决定 当前 的 隐 状 态 , 即 源 语 言 句 子 的 信息 编码 、 上 一 个 时 刻 目标 语言 的 隐 状 
态 , 以 及 上 一 个 时 刻 的 输出 词汇 。 然 后 再 用 得 到 的 隐 状 态 通过 Softmax 计算 目标 语言 词 
表 中 每 一 个 词汇 的 输出 概率 。 这 个 解码 过 程 要 通过 一 个 Beam Search 得 到 一 个 最 优 的 输 
出 序列 , 即 目标 语言 的 句子 。 后 来 进一步 发 展 了 注意 力 模型 ,通过 计算 上 一 个 隐 状 态 和 源 
语言 句子 的 隐 状 态 的 相似 度 对 源 语 言 的 隐 状 态 加 权 , 体 现 源 语言 句子 编码 的 每 一 个 隐 状 
态 的 对 解码 的 作用 。 

图 8-12 给 出 了 Sutskever 等 人 提出 的 架构 。 无 论 是 编码 器 ,还 是 解码 器 ,Sutskever 
等 人 都 采用 了 递归 神经 网 络 。 给 定 一 个 源 语 言 句子 “A B C”, 该 模型 在 尾部 增加 了 一 个 
表示 句子 结束 的 符号 “< EOS 之 ”。 当 编码 器 为 整个 句子 生成 向 量 表示 后 ,解码 器 便 开 始 
生成 目标 语言 句子 ,整个 解码 过 程 直 到 生成 “天 EOS>” 时 结束 。 需 要 注意 的 是 , 当 生 成 目 
标语 言词 *X” 时 ,解码 器 不 但 考虑 整个 源 语言 句子 的 信息 ,还 考虑 已 经 生成 的 部 分 译文 
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( 即 “W”)。 由 于 引入 了 LSTM, 端 到 端 神经 机 器 翻译 的 性 能 大 幅度 提升 ,取得 了 与 传统 统 
计 机 器 翻译 相当 甚至 更 好 的 准确 率 。 然 而 ,这 种 新 的 框架 仍 面临 一 个 重要 的 挑战 , 即 不 管 
是 较 长 的 源 语言 句子 ,还 是 较 短 的 源 语言 句子 ,编码 器 都 需 将 其 映射 成 一 个 维度 固定 的 向 
量 , 这 对 实现 准确 的 编码 提出 了 极 大 的 挑战 。 
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图 8-12 端 到 端 神经 机 器 翻译 


针对 编码 器 生成 定 长 向 量 的 问题 , Yoshua Bengio 研究 组 提出 了 基于 注意 力 
(attention) 的 端 到 端 神经 网 络 翻译 。 所 谓 注意 力 , 是 指 当 解码 器 在 生成 单个 目标 语言 词 
时 , 仅 有 小 部 分 的 源 语言 词 是 相关 的 , 绝 大 多 数 源 语言 词 都 是 无 关 的 。 例 如 ,在 图 8-11 
中 , 当 生成 目标 语言 词 “money” 时 ,实际 上 只 有 “* 钱 ?是 与 之 密切 相关 的 ,其 余 的 源 语言 词 
都 不 相关 。 因 此 ,Bengio 研究 组 主张 为 每 个 目标 语言 词 动态 生成 源 语言 端的 上 下 文 向 
量 , 而 不 是 采用 表示 整个 源 语言 句子 的 定 长 向 量 。 为 此 ,他 们 提出 了 一 套 基 于 内 容 
(content-based) 的 注意 力 计 算 方法 。 实 验 表明 ,注意 力 的 引入 能 够 更 好 地 处 理 长 距离 依 
赖 ,显著 提升 端 到 端 神经 机 器 翻译 的 性 能 。 

端 到 端 神经 机 器 翻译 存在 的 主要 问题 是 : 可 解释 性 差 和 训练 复杂 度 高 。 在 神经 网 络 
机 器 翻译 中 ,如 何 把 单 语 语 料 用 起 来 ? 如 何 融 入 语言 知识 和 翻译 知识 ?目前 的 翻译 都 是 
句子 级 进行 翻译 的 ,在 翻译 第 N 句 时 ,没有 考虑 前 N 一 1 句 的 源 语言 和 翻译 的 信息 。 例 
如 ,“ 中 巴 友 谊 ”到 底 是 中 国 一 巴西 ,还 是 中 国 一 巴基斯坦 ? 如 何 利 用 上 下 文 推断 翻译 ?这 
些 都 值得 研究 。 


8.7.6 ”未 来 展望 


机 器 翻译 研究 的 发 展 趋势 是 不 断 降低 人 在 翻译 过 程 中 的 主导 作用 : 基于 规则 的 方法 
完全 靠 人 编纂 翻译 规则 ;基于 统计 的 方法 能 够 从 数据 中 自动 学 习 翻译 知识 ,但 仍 需 要 人 设 
计 翻 译 过 程 的 隐 结 构 和 特征 ;基于 深度 学 习 的 方法 则 可 以 直接 用 神经 网 络 描述 整个 翻译 
过 程 。 近 年 来 , 端 到 端 神经 机 器 翻译 成 为 最 热门 的 研究 领域 ,未 来 的 研究 方向 可 能 集中 在 
以 下 5 个 方面 。 

。 架构 : 如 何 设计 表达 能 力 更 强 的 新 架构 ? 近期 提出 的 神经 网 络 图 灵机 和 记忆 网 
络 可 能 成 为 下 一 个 关键 技术 。 
训练 : 如 何 降低 训练 复杂 度 ? 如 何 更 有 效 地 提高 翻译 质量 ? 近期 的 工作 表明 直 
接 优化 评价 指标 能 够 显著 提升 翻译 性 能 。 

先 验 知识 : 目前 的 方法 完全 从 数据 中 自动 学 习 翻译 知识 ,能 否 利用 先 验 知识 指导 
翻译 过 程 ” 能 否 与 现 有 的 知识 库 相 结合 ? 近期 在 基于 注意 力 的 翻译 模型 上 的 研 
究 工 作 已 经 有 一 些 初步 进展 。 
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。 多 语言 : 目前 的 方法 主要 处 理 中 文 和 英文 等 资源 丰富 语言 ,能 和 否 处 理 更 多 的 语言 
对 ? Bengio 研究 组 提出 的 基于 共享 注意 力 机 制 的 多 语言 翻译 方法 值得 关注 。 
。 多 模 态 : 目前 的 方法 主要 关注 文本 翻译 ,能 否 利用 向 量 表示 贯通 文本 、 语 音 和 图 
像 ,实现 多 模 态 翻译 ? 最 近 在 图 像 标题 翻译 上 的 研究 工作 是 很 好 的 尝试 。 
基于 深度 学 习 的 机 器 翻译 方法 (尤其 是 端 到 端 神经 机 器 翻译 ) 会 取得 更 大 突破 ,发 展 
成 为 机 器 翻译 的 主流 技术 。 
人 类 的 翻译 追求 " 信 、 达 、 雅 ”的 境界 。 所 谓 * 信 ”, 就 是 忠实 原文 ,在 刻画 的 内 容 和 意境 
上 在 表达 风格 上 ,在 语言 运用 的 手法 上 都 应 该 与 原文 一 致 ;* 达 ”就 是 通顺 流畅 ,符合 句法 
语义 ,保持 上 下 文 的 衔接 与 连贯 ;* 雅 ” 则 是 优雅 ,需要 有 艺术 的 色彩 。 
“ 信 、 达 、 雅 ”是 无 止境 的 。 即 使 是 人 类 翻译 家 ,也 很 难说 自己 的 翻译 完全 做 到 了 “ 信 、 
达 , 雅 ”, 或 者 很 难说 在 “ 信 、 达 、 雅 ”方面 , 谁 比 谁 翻译 得 更 好 。 并 没有 一 个 客观 地 度量 “ 信 、 
达 、 雅 ”的 指标 体系 ,机 器 翻译 似乎 永远 没有 确定 的 答案 ,但 存在 可 逐步 逼近 的 目标 和 巨大 
的 应 用 需求 。 


8.8 语音 识别 


本 节 将 简单 介绍 语音 识别 。 首 先 从 声波 分 析 开 始 ,抽取 与 构成 单词 的 发 音 单元 相关 
的 特征 。 发 音 单元 的 清晰 特性 是 不 确定 的 ,在 最 终 的 单词 识别 阶段 ,采用 一 个 模型 ,将 已 
提炼 出 的 发 音 单元 序列 与 单词 序列 进行 匹配 。 


8. 8.1 智能 语音 技术 概述 


智能 语音 技术 经 过 几 十 年 的 发 展 和 积累 ,经 历 了 模板 匹配 、 统 计 方法 和 深度 学 习 方法 
阶段 。 在 模板 匹配 和 统计 学 习 阶 段 , 主 要 是 根据 发 音 机 理 和 听 感 特性 ,设计 语音 特征 提取 
和 归 一 化 方法 ,根据 特征 距离 或 分 布 概率 计算 语音 的 帧 级 匹配 度 , 结 合 动 态 规划 算法 搜索 
最 优 序 列 。 在 深度 学 习 阶段 ,特征 提取 和 帧 级 匹配 度 计算 统一 用 深度 神经 网 络 (DNN) 
建 模 , 极 大 地 提高 了 建 模 精确 度 。 目 前 ,智能 语音 技术 已 经 形成 了 相对 完备 的 技术 体系 ， 
如 图 8-13 所 示 , 主 要 包含 5 个 方面 。 


Le 看 音 唤醒 
ED 降 强 语音 唤醒 


“> 半音 合成 然 语言 生成 对 话 管理 推荐 引擎 





图 8-13 智能 语音 技术 框架 


(1) 语音 降 噪 与 增强 技术 。 解 决 复杂 真实 场景 下 的 语音 回声 消除 .语音 测 向 波束 形 
成 .去 混 响 ,分 离 , 降 噪 和 增强 等 ,提升 真实 应 用 场景 下 的 语音 信 品 比 ; 同 时 与 后 端 声学 模 
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型 的 适 配 ,是 实现 高 精度 语音 识别 和 唤醒 的 基础 。 

(2) 高 性 能 低 功 耗 语音 唤醒 技术 。 语 音 唤 醒 技 术 对 解放 双手 和 双眼 ,实现 自由 语音 
交互 具有 关键 作用 。 其 最 大 的 挑战 在 于 ,在 保证 复杂 真实 场景 噪声 、 复 杂 用 户口 音 、 较 高 
语音 唤醒 率 的 情况 下 ,要 同时 将 系统 的 误 唤醒 率 和 资源 、 功 耗 降低 到 最 小 程度 。 

(3) 高 精度 语音 识别 技术 。 主 要 解决 复杂 真实 场景 噪声 ,用户 口音、 垂直 领域 下 的 把 
语音 转化 成 文字 的 问题 ,需要 快速 定制 或 自 适应 用 户 ,以 提升 用 户 体验 。 

(4) 高 自然 度 和 个 性 化 情感 语音 合成 技术 。 传 统 的 以 信息 传达 为 目的 的 语音 合成 已 
经 不 成 问题 ,最 大 的 挑战 在 于 适应 用 户 对 合成 音质 音色、 情感 前 律 ,以 及 快速 模拟 特定 说 
话 人 的 需求 ,对 交互 系统 的 用 户 体验 而 言 至 关 重 要 。 

(5) 口语 理解 ,对话 管理 和 生成 技术 。 结 合 说 话 人 现场 上下文. 用 户 画 像 、 领 域 知识 
库 等 语 境 信 息 ,理解 用 户 语言 的 会 话 含义 ,根据 对 话 管理 策略 获取 外 部 内 容 或 服务 ,生成 
自然 语言 应 答 ,这 属于 认 知 计算 的 范畴 。 目 前 最 大 的 挑战 在 于 缺乏 统一 和 有 效 的 框架 , 需 
要 针对 特定 垂直 领域 进行 专门 的 定制 优化 。 

智能 语音 技术 是 语音 产业 应 用 的 基础 , 随 着 深度 学 习 技 术 演 进 和 大 数据 积累 ,性 能 指 
标 会 持续 提升 。 目 前 , 端 到 端 深度 学 习 算法 在 语音 识别 ,语音 合成 .机 器 翻译 和 对 话 系 统 
方面 都 取得 了 突破 性 进展 ,未 来 需要 突破 的 主要 技术 点 包括 如 下 4 个 方面 。 

(1) 小 数据 机 器 学 习 或 自 适应 方法 。 通 过 少量 样本 数据 ,实现 既 有 模型 对 特定 说 话 
人 、 环 境 噪声 .应 用 领域 的 快速 自 适应 。 

(2) 轻 监督 和 无 监督 机 器 学 习 方法 。 从 少量 数据 的 有 监督 学 习 转 向 利用 海量 数据 的 
半 监 督学 习 和 无 监督 学 习 , 将 模型 训练 的 数据 规模 从 人 工 标注 规模 的 有 限 数 据 ,扩展 到 无 
须 人 工 标注 的 超大 规模 数据 ;从 简单 分 类 任务 判别 模型 转向 生成 模型 ,从 而 取得 显著 的 模 
型 覆盖 度 和 性 能 指标 提升 。 

(3) 结合 多 种 语 境 信息 的 语 用 计算 。 在 人 机 对 话 过 程 中 ,要 正确 理解 用 户 话语 的 含 
义 , 不 仅 要 看 字面 含义 ,还 要 在 语 用 的 层次 上 理解 , 即 要 结合 多 种 语 境 信息 ,以 理解 其 会 话 
含义 。 这 些 语 境 信 息 包括 一 些 说 话 现场 的 语 境 , 如 说 话 的 时 间 、 地 点 、 场 所 、 设 备 传感器 获 
取 到 的 信息 ;也 包括 我 们 常 说 的 言语 语 境 ,也 就 是 话语 的 上 下 文 ; 还 包括 知识 语 境 ,如 背景 
知识 领域 知识 、 用 户 画 像 信 息 ,设备 角色 设 定 信 息 等 。 

(4) 知识 图 谱 和 深度 学 习 的 融合 。 即 让 深度 学 习 模型 有 效 利用 大 量 存 在 的 先 验 知 
识 。 与 一 般 分 类 器 相 比 ,神经 网 络 内 部 具有 一 定 的 记忆 特性 ,深度 神经 网 络 隐藏 层 还 具有 
一 定 的 抽象 能 力 , 因 而 把 神经 网 络 引入 自动 问答 及 相关 领域 (如 阅读 理解 ) 有 利于 问题 的 
优化 和 简化 ,同时 使 得 知识 图 谱 和 阅读 理解 系统 具有 一 定 的 推理 能 力 和 泛 化 能 力 。 此 外 ， 
神经 网 络 直接 访问 记忆 库 ( 内 存 ) 知识 结 构 等 外 部 依据 大 大 拓展 了 神经 网 络 的 用 途 , 从 记 
忆 网 络 (memory network) 到 可 微 神经 网 络 计算 架构 (DNC) 的 技术 变革 ,使 得 神经 网 络 
不 再 局 限于 基于 最 大 似 然 概率 的 拟 合 和 特征 抽取 , 转 而 向 全 新 的 拟人 计算 机 晓 变 ,驱动 知 
识 数据 、 人 逻辑 分 析 与 计算 能 力 的 融合 , 甚至 促进 真正 的 通用 智能 发 展 。 


8. 8.2 组 成 单词 读音 的 基本 单元 


局 部 计算 存储 器 中 的 连续 语音 识别 软件 和 用 麦克 风 输 入 的 语音 信息 ,允许 使 用 者 将 
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语音 直接 转换 为 文档 。 

由 于 使 用 者 声音 上 的 细微 差别 ,还 需要 使 用 者 训练 识别 器 。 某 些 现代 航空 器 使 用 有 
限 的 词汇 ,允许 飞行 员 使 用 语音 发 出 命令 。 计 算 机 上 的 软件 包 也 能 对 语音 命令 产生 反应 。 
但 是 ,对 于 下 面 这 样 的 句子 ,当前 应 用 程序 的 能 力 还 远 远 无 法 要 求 系统 进行 反应 。 

Back up all the program files for the projects I have worked on today. 

这 样 的 命令 需要 自然 语言 理解 。 如 果 理 解 系统 的 输入 是 语音 ,而 不 是 文本 ,那么 复杂 
度 就 要 大 得 多 。 如 果 用 印刷 文本 作为 输入 ,那么 就 能 清楚 地 区 分 单个 单词 和 单词 串 , 而 用 
语音 输入 则 不 行 。 一 个 可 能 的 方法 是 在 语音 识别 结束 后 ,再 更 正 识别 错误 。 当 对 单个 单 
词 进行 识别 时 ,口语 有 很 多 的 不 确定 性 。 很 多 情况 下 , 当 与 朋友 进行 交流 时 ,可 以 猜测 他 
所 说 的 是 哪 一 个 单词 ,这 种 猜测 往往 是 根据 上 下 文 提供 的 信息 得 到 的 。 此 外 ,与 朋友 交谈 
时 ,说 话 者 还 可 以 使 用 音调 、 面 部 表情 和 手势 等 传达 很 多 信息 。 同 时 ,说 话 者 会 经 常 更 正 
他 说 过 的 话 ,而 且 会 使 用 不 同 的 词 重 复 某 些 信 息 。 因 为 不 同 的 词 可 能 发 音 相同 ,这 将 使 问 
题 变 得 更 复杂 ,如 fare 和 fair,mail 和 male 等 。 

语音 识别 系统 需要 几 个 层次 的 处 理 。 词 语 以 声波 传送 ,声波 也 就 是 模拟 信号 ,信号 处 
理 器 传送 模拟 信号 ,并 从 中 抽取 诸如 能 量 、 频 率 等 特征 。 然 后 ,这 些 特征 映射 为 称 作 音 素 
的 单个 语音 单元 。 单 词 的 发 音 是 由 音素 组 成 的 ,因此 ,最 终 阶 段 是 将 * 可 能 的 ”音素 序列 转 
换 成 单词 序列 。 之 所 以 使 用 * 可 能 的 ?这 个 词 , 是 因为 由 声音 传送 的 音素 的 识别 是 不 确 
定 的 。 

语音 的 产生 要 求 将 单词 映射 为 音素 序列 ,然后 将 之 传送 给 语音 合成 器 ,单词 的 声音 ji 
过 说 话 者 从 语音 合成 器 发 出 。 此 外 ,还 有 一 个 语调 计划 器 ,使 得 合成 器 知道 如 何 使 用 声音 
变化 ,而 不 是 应 用 不 自然 的 单调 对 话 讲话 。 本 章 主 要 关注 语音 识别 ,但 所 讲 内 容 与 语音 的 
产生 有 关 。 

构成 单词 发 音 的 独立 单元 是 音素 。 对 于 一 种 语言 ,如 英语 ,必须 将 声音 的 不 同 单元 识 
别 出 来 并 分 成 组 。 分 组 时 ,应 该 确保 语言 中 的 所 有 单词 都 能 被 区 分 ,两 个 不 同 的 单词 最 好 
由 不 同 的 音素 组 成 。 下 面 列 出 了 儿 个 音素 。 


[bj bin 
[p] pin 
[th] thin 
Ey lip 

[er] bird 
[ay] iris 


音素 可 能 由 于 上 下 文 不 同 而 发 音 不 同 。 例 如 ,单词 three 中 的 音素 th 的 发 音 不 同 于 
then 中 th 的 发 音 。 相 同音 素 的 这 些 不 同 变异 称 为 音素 变 体 。 有 时 ,抽取 读音 的 差别 将 其 归 
入 音 位 的 通用 分 组 中 是 很 方便 的 。 音 位 写 在 斜 线 中 间 , 例 如 /th/ 是 一 个 音 位 ,依据 上 下 文 的 
不 同 而 有 不 同 读音 。 单 词 可 以 在 音 位 层 表示 , 若 需要 更 多 信息 ,可 在 音素 变 体 层 表示 。 


8.8.3 信号 处 理 


声波 在 空气 压力 下 会 发 生变 化 。 声 波 有 两 个 主要 特征 : 一 个 是 振幅 , 它 可 以 衡量 某 
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一 时 间 点 的 空气 压力 ; 另 一 个 是 频率 , 它 是 振幅 变化 的 速率 。 当 对 着 麦克 风 讲 话 时 ,空气 
压力 的 变化 会 导致 振动 膜 发 生 振荡 ,振荡 的 强度 与 空气 压力 (振幅 ) 成 正比 ,振动 膜 振荡 的 
速率 与 压力 变化 的 速率 成 正比 。 因 此 ,振动 膜 离开 它 的 固定 位 置 的 偏 移 量 就 是 振幅 的 度 
量 。 按 照 空 气 是 压缩 的 或 是 膨胀 (稀薄 ) 的 ,振动 膜 的 偏 移 可 以 被 描述 为 正 或 负 。 偏 离 的 
幅度 取决 于 当 振 动 膜 在 正 值 与 负 值 之 间 循 环 时 ,在 哪 一 个 时 间 点 测量 偏差 值 。 这 些 度量 
值 的 获取 称 为 采样 。 当 声波 被 采样 时 ,绘制 成 一 个 zy 平面 图 ,zx 轴 表 示 时 间 ,y 轴 表 示 
振幅 ,每 秒 钟 声 波 重复 的 次 数 为 频率 。 每 一 次 重复 是 一 个 周期 ,所 以 ,频率 为 10 意味 着 
ls 内 声波 重复 10 次 一 一 每 秒 10 个 周期 或 更 一 般 地 表示 为 10Hz。 

声音 的 音量 与 功率 的 大 小 有 关 , 与 振幅 的 平方 有 关 。 用 肉眼 观察 声波 的 波形 得 不 到 
多 少 信息 ,只 能 看 出 元 音 与 大 多 数 辅音 的 差别 。 但 是 , 仅 简单 地 看 一 下 波形 就 想 确定 一 个 
音素 是 元 音 , 还 是 辅音 是 不 可 能 的 。 从 麦克 风 捕 获 的 数据 包含 了 所 需 单词 的 信息 ,否则 就 
不 可 能 将 语音 记录 下 来 ,并 将 其 回放 为 可 理解 的 语音 。 然 而 ,语音 识别 的 要 求 是 抽取 能 够 
帮助 辨别 单词 的 信息 ,这 些 信 息 应 该 很 简洁 而 且 易 于 进行 计算 。 典 型 地 ,应 该 将 信号 分 割 
成 若干 块 ,从 块 中 抽取 大 量 不 连续 的 值 , 这 些 不 连续 的 值 通常 称 为 特征 。 信 号 的 每 个 块 称 
为 帧 ,为 了 保证 可 能 落 在 帧 边缘 的 重要 信息 不 会 丢失 ,应 该 使 帧 有 重要 。 

人 们 说 话 的 频率 在 10kHz 以 下 (每 秒 10000 个 周期 )。 每 秒 得 到 的 样本 数量 应 是 需 
要 记录 的 最 高 语音 频率 的 两 倍 。 理 论 上 说 ,这 样 做 可 以 使 频率 不 会 丢失 (图 8-14)。 当 使 
用 20kHz 的 采样 频率 时 ,标准 的 一 帧 为 10ms ,包含 200 个 采样 值 。 每 个 采样 值 都 是 一 个 
实数 值 ,表示 一 种 强度 。 每 个 实数 值 都 将 被 转化 为 一 个 整数 存储 起 来 ,这 样 做 称 为 量化 。 
实数 值 必须 进行 四 舍 五 入 ,以 便 转换 成 离 它 最 近 的 整数 值 ,因此 , 某 些 信息 将 会 丢失 。 如 
果 使 用 8 位 的 整数 值 ,那么 ,每 个 采样 值 可 以 取 256 个 整数 中 的 一 个 。 采 样 将 连续 的 信号 
转换 为 一 串 不 连续 的 值 , 换 句 话说 ,信号 被 数字 化 了 。 下 一 阶段 是 要 获取 数字 化 的 信号 并 
抽取 特征 。 

图 8-14 中 的 实 线 正弦 波 是 真实 波 , 它 在 每 个 标 虚线 的 波 周期 内 完成 3 个 周期 。 黑 色 
圆圈 表示 以 真实 波 两 倍 的 频率 获取 的 样本 ,这 个 采样 捕获 了 真实 的 正弦 波 。 星 号 表示 正 
在 被 采样 ,以 这 样 的 采样 率 , 可 认为 得 到 的 是 虚线 波 , 它 是 真实 波 频率 的 1/3。 这 表明 , 采 
样 频率 应 为 所 需 测量 最 高 频率 的 两 倍 。 
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图 8-14 声波 波形 
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从 数字 化 信号 中 抽取 特征 的 一 种 方法 是 进行 傅 里 叶 变换 。 一 段 声波 可 以 表示 为 正弦 
波 的 组 合 , 如 图 8-15 所 示 。 每 个 正弦 波 都 有 频率 与 振幅 。 傅 里 叶 变换 可 用 来 识别 组 成 声 
波 时 影响 最 大 的 频率 ,抽取 出 的 频率 集合 称 为 频谱 。 图 8-16 中 的 波 已 被 数字 化 采样 , 它 
是 3 个 正弦 波 之 和 。 








(a) 声波 (b) 3 个 正弦 波 的 组 合 
图 8-15 ”声波 表示 为 3 个 正弦 波 的 组 合 
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(a) 声波 (b) 3 个 正弦 波 的 频谱 
图 8-16 声波 及 其 频谱 


2sin(2rX50L) 十 sin(2rX1201) 十 4sin(2rX2000) 
这 里 ,是 时 间 , 这 3 个 正弦 波 的 频谱 如 图 8-16(b) 所 示 。 频 谱 中 有 3 个 峰值 ,每 个 峰值 都 
在 正弦 波 的 频率 中 心 ,这 段 频谱 是 由 数字 化 采样 波 经 过 傅 里 叶 变换 得 到 的 。 

在 语音 识别 中 ,常用 另 一 种 称 为 线性 预测 编码 (Linear Predictive Coding,LPC) 的 技 
术 抽 取 特 征 。 傅 里 叶 变 换 可 用 来 在 后 一 阶段 中 提取 附加 信息 。LPC 把 信号 的 每 个 采样 
表示 为 前 面 采样 的 线性 组 合 。 预 测 需 要 对 系数 进行 估计 ,系数 估计 可 以 通过 使 预测 信号 
和 附加 真实 信号 之 间 的 均 方 误差 最 小 实现 。 

频谱 代表 波 不 同 频率 的 组 成 成 分 , 它 可 以 利用 傅 里 叶 变 换 、LPC 或 其 他 方法 得 到 。 
频谱 能 识别 出 与 不 同音 素 相 匹配 的 主 控 频 率 , 这 种 匹配 可 以 产生 不 同音 素 的 可 能 性 估计 。 

总 之 ,语音 处 理 包括 从 一 段 连续 声波 中 采样 ,将 每 个 采样 值 量化 ,产生 一 个 波 的 压缩 
数字 化 表示 。 采 样 值 位 于 重 委 的 帧 中 ,对 于 每 一 帧 ,抽取 出 一 个 描述 频谱 内 容 的 特征 向 
量 。 然 后 ,音素 的 可 能 性 可 通过 每 帧 的 向 量 计算 。 
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8. 8.4 单个 单词 的 识别 


一 旦 声 源 被 简化 为 特征 集合 ,下 一 个 任务 是 识别 这 些 特征 代表 的 单词 ,本 节 重 点 关注 
单个 单词 的 识别 。 识 别 系统 的 输入 是 特征 序列 。 当 然 ,单词 对 应 于 字母 序列 。 如 果 要 分 
析 一 个 大 的 单词 库 , 就 要 识别 某 种 字母 序列 比 其 他 字母 序列 更 有 可 能 发 生 的 模式 。 例 如 ， 
字母 y 与 在 ph 后面 出 现 的 概率 要 大 于 与 在 t 后 面 出 现 的 概率 。 马 尔 可 夫 模 型 是 表示 序 
列 可 能 出 现 的 一 种 方法 。 图 8-12 是 马尔 可 夫 模 型 的 一 个 例子 。 模 型 中 有 4 个 状态 ,分 别 
标记 为 1 一 4。 边 代表 从 一 个 状态 到 另 一 个 状态 的 转移 ,每 条 边 上 有 一 个 权 值 , 表 示 状 态 
转移 的 概率 。 下 面 的 值 是 观察 权 值 , 每 个 状态 可 以 发 出 它 下 面 列 出 的 符号 之 一 , 权 值 是 概 
率 ,显示 发 出 每 个 符号 的 相对 频率 。 注 意 ,一 个 符号 可 以 被 多 个 状态 发 出 。 在 图 8-17 中 ， 
状态 4 不 会 再 转向 其 他 状态 ,被 认为 是 终止 状态 。 对 于 任何 状态 ,只 能 顺 着 箭头 的 方向 进 
行 状态 转移 ,而 从 一 个 状态 发 出 的 所 有 箭头 上 的 概率 之 和 为 1。 状 态 可 以 代表 组 成 单词 
的 字母 ,但 这 里 只 讨论 通常 的 状态 。 








O!1 0.5 O2 07 O40.5 O6 0.6 
O2 03 O4 0.1 O56 04 O2 02 
©O3 02 O5 02 O701 Os 02 


图 8-17 一 个 隐 马 尔 可 夫 模 型 


图 8-17 中 的 模型 可 以 看 作 是 一 个 序列 生成 器 。 例 如 ,车 从 状态 1 开始 ,在 状态 4 结 
束 , 下 面 是 可 能 生成 的 一 些 序列 。 

用 

这 这 证 

12334 

1 

任何 序列 生成 的 概率 都 可 以 计算 出 来 ,生成 某 个 序列 的 概率 就 是 生成 该 序列 路 径 上 
的 所 有 概率 之 积 。 

例如 ,对 于 序列 : 1 23 3 4 
路 径 是 下 列 边 的 集合 : 

1-2,2-3,3-3,3-4 
概率 为 

0.9X0.5X0.4X0.6 一 0.108 
某 些 序列 比 其 他 序列 生成 的 可 能 性 更 高 。 马 尔 可 夫 模型 的 关键 假设 是 下 一 个 状态 只 取决 
于 当前 状态 。 
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8.8.5 隐 马 尔 可 夫 模型 


在 讨论 有 关 语音 识别 的 具体 问题 前 ,首先 对 隐 马 尔 可 夫 模 型 (Hidden Markov 
Model, HMM) 进 行 一 般 性 介绍 。 之 所 以 称 为 隐 马 尔 可 夫 模 型 ,是 因为 在 任意 时 间 机 器 所 
处 的 状态 对 用 户 都 是 隐藏 的 。 这 种 情形 在 许多 应 用 中 都 会 出 现 ,因为 从 传感器 得 到 的 数 
据 并 不 是 正好 与 隐 马 尔 可 夫 模 型 中 的 状态 对 应 。 在 语音 识别 中 ,输入 数据 是 从 声波 中 抽 
取出 的 特征 。 马 尔 可 夫 模 型 中 的 状态 相当 于 声音 的 单元 (如 音素 )。 使 用 者 不 知道 输入 的 
特征 相当 于 什么 状态 。 即 便 特征 并 不 准确 地 对 应 于 隐 马 尔 可 夫 模 型 中 的 状态 ,使 用 者 也 
可 以 对 可 能 的 状态 做 出 较 好 的 猜测 。 尽 管 音 素 有 一 些 共 同 的 声音 特征 ,但 是 不 同 的 音素 
发 音 不 同 ,音素 间 的 差异 可 以 使 人 们 猜 出 某 个 音素 到 底 是 什么 。 于 是 ,给 定 一 个 特征 ,可 
以 知道 哪些 状态 更 有 可 能 与 此 特征 相对 应 。 尽 管 不 能 确定 到 底 是 哪 一 个 状态 ,但 至 少 问 
题 变 得 容易 了 ,因为 很 多 状态 已 经 被 排除 在 外 。 假 设 有 一 个 特征 序列 ,识别 器 获取 了 第 一 
个 特征 , 它 并 不 清楚 这 个 特征 相当 于 哪 一 个 状态 ,但 它 可 以 通过 猜测 减少 可 能 状态 的 数 
目 。 然 后 ,识别 器 获取 了 第 二 个 特征 ,继续 减少 可 能 的 状态 数 。 在 获取 第 三 个 特征 后 仍然 
以 这 种 方式 继续 。 当 识别 器 获取 更 多 的 特征 时 ,将 能 进一步 减少 可 能 出 现 的 状态 数量 , 因 
为 它 知道 某 些 特征 可 能 会 更 频繁 地 同时 出 现 一 一 识别 器 有 一 些 有 关 特 征 序列 ,以 及 一 个 
音素 在 另 一 个 音素 之 后 出 现 概 率 的 信息 。 隐 马尔 可 夫 模 型 建立 了 单词 特征 及 一 个 特征 出 
现在 另 一 个 特征 之 后 的 概率 模型 。 

图 8-17 显示 了 每 个 状态 的 观察 符号 列表 。 现 将 模型 看 作 是 一 个 生成 器 ,模型 发 出 的 
是 一 个 观察 符号 序列 ,而 不 是 状态 序列 。 如 果 识 别 器 运行 100 次 ,从 状态 1 开始 ,使 用 者 
期 望 大 约 50% 的 序列 以 符号 Ol 开始 ,30% 的 序列 以 符号 O2 开始 ,20% 的 序列 以 符号 
O 〇 3 开始。 这些 百 分 比 就 是 这 些 符号 从 状态 1 产生 的 概率 。 从 状态 1 出 发 ,最 可 能 转向 
的 状态 是 2, 但 有 10% 的 可 能 会 转向 状态 3。 因 此 ,O2,O4,O 〇 5,O 〇 6,O 〇 7 可 能 跟 在 〇 1 
之 后 。 符 号 〇 2 最 有 可 能 出 现在 序列 中 的 下 一 个 位 置 ,因为 状态 2 跟 在 状态 1 后 出 现 的 
可 能 性 较 大 ,并 且 在 状态 2 产生 的 符号 中 〇 2 的 概率 远 远 大 于 其 他 几 个 符号 。 注 意 , 同 一 
个 观察 符号 值 可 以 被 不 止 一 个 状态 产生 。 例 如 ,O 〇 2 可 以 由 状态 1,2,4 产生。 

给 定 一 个 观察 序列 ,我 们 通常 对 两 类 计算 感 兴趣 。 第 一 , 想 找 出 马尔 可 夫 模 型 中 最 可 
能 的 路 径 。 最 可 能 的 路 径 确定 哪个 状态 序列 连同 状态 激活 的 次 序 最 有 可 能 产生 观察 序 
列 。 第 二 ,对 计算 模型 生成 的 序列 的 可 能 性 感 兴趣 。 在 模型 中 ,可 能 会 有 几 条 路 径 都 能 产 
生 序列 ,序列 的 可 能 性 应 为 这 几 条 路 径 上 出 现 的 概率 之 和 。 考 虑 下 面 的 序列 : 

O1 O2 O4 O4 O6 O6 
每 个 符号 对 应 一 个 不 同 的 时 间 步 又 。 在 时 间 1 接收 〇 1, 在 时 间 2 接收 O2, 在 时 间 3 和 时 
间 4 接收 〇 4, 在 时 间 5 和 时 间 6 接收 〇 6。 这 里 ,不 关心 时 间 间 隔 的 大 小 。 第 1 个 观察 符 
号 是 O1,O 〇 1 只 能 由 状态 1 生成 。 因 此 ,在 该 例 中 ,识别 器 从 状态 1 开始 。 状 态 1 只 能 转 
向 状态 2 或 状态 3。 下 一 个 观察 符号 是 〇 2, 它 不 能 由 状态 3 生成 ,所 以 ,序列 中 的 下 一 个 
状态 应 是 状态 2。 而 从 状态 2 可 以 转向 状态 3、 状 态 4 或 维持 状态 2 不 变 。 因 为 状态 4 不 
能 生成 O4, 因 此 ,必须 转向 状态 3 或 保持 状态 2 不 变 。 现 在 ,实际 的 状态 是 隐藏 的 ,识别 
器 并 不 知道 OQ4 的 第 一 次 出 现 是 在 状态 2, 还 是 在 状态 3。 但 是 ,识别 器 可 以 确定 产生 〇 4 
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的 最 可 能 状态 。 

在 识别 问题 中 ,输入 的 是 观察 序列 ,而 观察 序列 是 由 信号 处 理 抽取 得 到 的 特征 。 不 同 
的 单词 有 不 同 的 转移 状态 和 概率 ,识别 器 的 任务 是 确定 哪 一 个 单词 模型 是 最 可 能 的 。 因 
此 ,需要 一 种 实现 抽取 路 径 的 方法 。 假 设 不 了 解 任何 起 始 状态 与 终止 状态 的 信息 。 当 收 
到 一 个 观察 值 时 ,并 不 知道 观察 值 对 应 哪个 状态 。 对 于 观察 序列 中 的 每 一 个 观察 值 ,都 存 
在 一 个 与 之 对 应 的 未 知 状态 。 将 各 条 不 同 路 径 可 视 化 的 一 种 方法 是 构造 格子 。 格 子 中 包 
含 马尔 可 夫 模 型 中 每 一 个 时 间 步 又 对 应 的 状态 备份 。 因 此 , 若 序 列 中 有 6 个 观察 值 , 就 会 
有 状态 的 6 个 备份 排列 成 6 级 ,每 一 级 对 应 序列 中 的 一 个 时 间 步 又 。 当 前 级 j 与 其 相 邻 
的 下 一 个 级 7 十 1 之 间 的 状态 用 边 连 接 起 来 ,连接 各 级 的 边 就 相当 于 马尔 可 夫 模 型 的 边 。 
因此 ,只 有 在 马尔 可 夫 模 型 中 有 一 条 边 连 接 状 态 S 和 Sir 时 ,第 7) 级 中 的 状态 S; 才 会 与 
第 j 十 1 级 中 的 状态 Si+1 相连。 

使 用 马尔 可 夫 模 型 对 语音 建 模 有 几 种 不 同 的 方法 。 一 种 方法 是 在 单词 级 构造 马尔 可 
夫 模 型 ,其 状态 对 应 音素 。 起 始 状 态 和 终止 状态 可 以 明确 地 识别 ,但 没有 必要 有 明确 的 起 
始 状 态 与 终止 状态 。 可 以 取而代之 的 是 ,提供 一 个 初始 分 布 ,以 确认 模型 中 从 每 一 个 状态 
开始 的 概率 。 每 个 状态 都 具有 自 循环 ,以 便 对 音素 的 持续 时 间 进 行 建 模 。 语 句 通常 由 单 
词 序列 组 成 ,一 个 单词 的 读音 会 与 下 一 个 单词 的 读音 相 混淆 ,这 就 使 得 辨别 单词 的 边界 变 
得 很 困难 。 识 别 和 分 开 单词 的 过 程 称 为 分 割 , 识 别 和 分 隔 单词 序列 的 过 程 与 将 单词 从 观 
察 序列 中 识别 出 来 的 过 程 本 质 上 是 相同 的 。 识 别 器 将 接收 代表 单词 序列 的 观察 值 序 列 。 
马尔 可 夫 模 型 可 以 由 单个 单词 的 马尔 可 夫 模 型 构造 。 每 一 对 单词 都 用 边 连接 ,这 些 边 表 
示 一 个 单词 跟随 在 另 一 个 单词 后 出 现 的 概率 。 识 别 出 最 可 能 产生 的 观察 序列 的 路 径 , 这 
条 路 径 将 识别 出 每 个 单词 和 它们 在 讲话 中 出 现 的 顺序 。 

在 隐 马 尔 可 夫 模 型 中 经 常 使 用 概率 的 对 数 ,为 此 ,计算 过 程 将 由 加 法 组 成 。 在 语音 库 
上 通过 机 器 学 习 算法 获得 马尔 可 夫 模型 的 权 值 , 可 以 采用 基于 期 望 最 大 化 的 算法 ,也 可 以 
采用 神经 网 络 的 算法 。 





8. 8.6 深度 学 习 在 语音 识别 中 的 应 用 


近年 来 ,深度 学 习 在 语音 识别 .语音 合成 .语音 增强 .语音 转换 .语种 识别 等 研究 方向 
取得 了 积极 的 进展 。 

1. 基础 DNN-HMM 声学 模型 

与 传统 语音 识别 系统 普遍 采用 高 斯 混合 模型 - 隐 马 尔 可 夫 模型 (Gaussian Mixture 
Model-Hidden Markov Model,GMM-HMM) 声 学 模型 不 同 ,深度 学 习 采 用 的 是 深层 神经 
网 络 - 隐 马 尔 可 夫 模 型 (Deep Neural Networks-Hidden Markov Model, DNN-HMM) 声 学 
模型 。 与 传统 的 模型 相 比 ,DNN-HMM 的 性 能 有 了 较 大 幅度 提升 。DNN 的 使 用 方法 一 
般 有 两 种 形式 : 第 一 种 是 用 DNN 直接 代替 GMM-HMM 模型 中 的 GMM 模型 ,即将 
DNN 充当 音素 分 类 器 的 角色 ,然后 使 用 HMM 模型 进行 解码 。 这 种 方法 称 为 DNN- 
HMM 路 线 ,一 般 又 称 为 hybrid DNN-HMM 系统 。 第 二 种 是 利用 DNN 提取 高 层 信息 的 
特性 ,将 其 作为 一 种 特征 提取 网 络 ,提取 一 种 称 为 瓶颈 特征 (BottleNeck feature，BN) 的 
参数 蔡 代 传统 的 声学 特征 参数 ,用 于 训练 GMM-HMM 模型 。 这 种 方法 称 为 GMM- 
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HMM-BN 路 线 。 该 方案 的 特点 是 : 既 可 以 利用 DNN 强大 的 非 线 性 变换 能 力 ,又 可 以 利 
用 GMM 模型 训练 中 的 各 类 成 熟 的 技术 。 

DNN 相 比 于 GMM 的 优势 在 于 : 使 用 DNN 估计 HMM 状态 的 后 验 概率 分 布 不 
需要 对 语音 数据 分 布 进行 假设 ; ODNN 的 输入 特征 可 以 是 多 种 特征 的 融合 ,包括 离散 或 
者 连续 特征 ; @DNN 可 以 利用 相 邻 的 语音 帧 包含 的 结构 信息 。 已 有 研究 表明 ,DNN 的 
性 能 提升 主要 源 自 第 三 点 。 

除 DNN-HMM 声学 模型 外 ,深层 卷 积 网 络 (CNN) 和 循环 神经 网 络 (Recurrent 
Neural Network,， RNN) 近 期 也 应 用 于 语音 识别 的 声学 建 模 。 研 究 人 员 将 CNN 用 于 语 
音 识别 的 声学 建 模 。CNN 采用 局 部 滤波 (local filtering) 和 最 大 池 化 (max-pooling) 技 术 ， 
以 提取 与 语音 谱 峰 频率 位 移 无 关 的 语音 特征 参数 ,从 而 提高 语音 识别 器 对 不 同 说 话 人 的 
稳健 性 。 

RNN 直接 针对 整个 语音 段 进行 建 模 ,而 非 采用 DNN 的 对 局 部 语音 帧 分 类 的 方式 ， 
可 以 更 好 地 利用 历史 语音 做 出 全 局 决策 。Graves A 尝试 了 将 RNN 用 于 语音 识别 的 声学 
建 模 ,在 TIMIT 标准 任务 上 取得 了 音素 错误 率 17.7% 的 当时 最 好 识别 性 能 。 而 George 
S 等 人 则 基于 LSTM 方法 将 RNN 模型 成 果 应 用 于 大 词汇 量 连 续 语音 识别 系统 。 

CNN 和 RNN 等 网 络 结构 在 改善 语音 的 局 部 畸变 、 序 列 训练 等 问题 上 对 传统 DNN 
结构 形成 了 较 好 的 补充 ,并 有 在 未 来 替代 DNN 成 为 语音 识别 系统 标 配 的 潜力 。 

2. 大 数据 下 DNN-HMM 声学 模型 训练 

尽管 相 比 于 传统 的 GMM-HMM 系统 ,基于 DNN-HMM 的 语音 识别 系统 在 大 词汇 
量 连续 语音 识别 任务 中 取得 了 显著 的 性 能 提升 ,但 是 DNN 的 训练 是 一 个 相当 耗 时 的 工 
作 。 例 如 ,即使 通过 GPU 加 速 ,训练 一 个 普通 的 使 用 1000 小 时 语音 数据 集 的 6 隐 层 、 隐 
层 结 点 数 为 2048 的 DNN ,通常 仍 需要 数 周 的 时 间 。 

YuD 等 人 的 Sparse 方 案 ,通过 将 DNN 模型 参数 中 80% 的 较 小 参数 强制 为 0, 减 小 
模型 大 小 ,同时 几乎 没有 性 能 损失 。Sainath TN 等 人 的 低 秩 (low-rank) 方 案 提出 将 
DNN 中 权重 矩阵 分 解 为 两 个 低 秩 和 矩阵 的 乘积 ,从 而 达到 30% 一 50% 的 效率 提升 。 分 析 
Sparse 方案 的 各 种 配置 在 Switchboard 任务 上 对 识别 效果 和 模型 尺寸 的 影响 可 以 看 出 ， 
当 Sparse 方案 对 参数 强制 置 零 的 比例 较 低 ( 即 参 数 非 零 比例 较 高 ) 时 ,对 应 模型 的 识别 性 
能 相对 于 基线 模型 甚至 有 所 提升 ; 当 模型 尺寸 压缩 到 原始 模型 的 20% 左 右 时 ,对 识别 率 
的 影响 仍然 较 小 。 分 析 Low-rank 方案 在 Switchboard 任务 上 的 效果 (Low-rank 隐 层 数 
目 经 调 优 后 设置 为 512) ,在 模型 尺寸 压缩 了 1/3 的 前 提 下 获得 的 识别 效果 几乎 不 受 
影响 。 

DNN 训练 效率 的 另外 一 种 解决 方法 是 通过 使 用 多 个 CPU 或 者 GPU 并 行 训 
练 DNN。 

3. RNN 语言 模型 

深度 学 习 理 论 还 可 用 于 语言 模型 的 建 模 。 传 统 的 统计 语言 模型 使 用 N-gram 模型 进 
行 建 模 并 取得 了 良好 的 效果 。 

Mikolov T 等 人 将 循环 神经 网 络 (RNN) 引 入 到 语言 模型 建 模 中 。 理 论 上 ,标准 的 
RNN 能 够 通过 循环 网 络 结构 记忆 和 处 理 任 意 长 度 的 历史 信息 , 相 比 于 FFNN, 它 的 性 能 
可 以 更 好 。 该 方法 在 标准 WSJ 任务 上 进行 了 验证 ,实验 表明 ,RNN 方法 在 经 过 优化 并 和 
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传统 N-gram 模型 融合 后 ,不 仅 在 度量 语言 模型 的 文本 预测 准确 性 指标 混淆 度 
(perplexity) 上 相对 于 N-gram 模型 获得 了 45% 的 大 幅度 性 能 提升 ,而 且 在 实际 的 语音 识 
别 任务 上 也 获得 了 17. 8% 的 相对 错误 下 降 率 。 目 前 ,RNN 语言 模型 方案 作为 传统 N- 
gram 模型 的 有 效 补 充 ,逐渐 成 为 主流 语音 识别 系统 的 标 配 之 一 。 


8.9 ”机 器 阅读 理解 


阅读 理解 是 一 种 阅读 一 段 文本 对 其 进行 分 析 , 并 能 理解 其 中 意思 的 能 力 。 而 机 器 
阅读 理解 就 是 让 机 器 具备 文本 阅读 的 能 力 ,准确 理解 文本 的 语义 ,并 正确 回答 给 定 的 
问题 。 

阅读 理解 任务 中 有 3 个 核心 部 分 : 文档 、 问 题 和 选项 。 其 中 ,文档 通常 为 给 定 的 一 篇 
文档 或 者 几 段 文本 。 问 题 根据 这 个 文本 得 来 ,对 于 每 个 问题 ,会 提供 4 个 选项 ,通常 情况 
下 只 有 一 个 选项 是 正确 答案 ,系统 被 要 求 在 阅读 完 给 定 文档 后 ,根据 所 给 问题 ,从 4 个 选 
项 中 选择 出 正确 答案 。 


8.9.1 机 器 阅读 理解 评测 数据 集 


现 阶段 , 和 阅读 理解 相关 的 数据 集 主 要 有 MCTest、 bAbi、 CNN&Daily Mail、 
CBTest、 公 开 评 测 5 个 。 

MCTest 是 微软 研究 院 的 研究 员 Richardson 等 人 在 2013 年 的 EMNLP 上 发 布 的 一 
个 数据 集 。 在 这 个 数据 集中 ,所 有 的 文档 都 是 一 些 叙述 性 的 故事 。 它 考察 的 推理 能 力 被 
限定 于 一 个 7 岁 儿 童 可 以 接受 的 范围 内 ,包含 许多 常识 性 的 推理 ,这 些 推理 既 包 含 事实 性 
的 ,也 包含 非 事 实 性 的 。 这 个 数据 集 包 含 两 部 分 : 一 个 是 MC160; 还 有 一 个 是 MC500 ,分 
别 包 含 160 篇 和 500 篇 文档 。 由 于 这 个 数据 集 较 接近 我 们 真实 的 阅读 理解 场景 ,因而 成 
为 阅读 理解 相关 研究 者 的 首选 评测 数据 集 。 

目前 各 公开 的 数据 集 ,由 于 其 考察 系统 阅读 理解 能 力 侧重 点 的 不 同 ,因此 构造 的 数据 
集 的 方式 ,规模 和 形式 也 不 尽 相同 。 从 已 有 研究 成 果 看 ,大 部 分 方法 目前 主要 侧重 于 系统 
对 文本 深层 次 的 语义 理解 能 力 , 因 此 ,大 部 分 机 器 阅读 理解 方法 都 集中 于 在 MCTest 数据 
集 进行 评测 。 下 面 围绕 MCTest 数据 集 介 绍 已 有 的 机 器 阅读 理解 方法 。 


8.9.2 机 器 阅读 理解 的 一 般 方法 


已 有 工作 可 以 大 致 分 为 两 类 : 一 类 是 传统 基于 特征 工程 的 方法 ; 另 一 类 是 基于 深度 
学 习 的 机 器 阅读 理解 方法 。 

1. 传统 基于 特征 工程 的 方法 

传统 方法 通常 将 机 器 阅读 理解 任务 看 作 是 语义 匹配 或 者 蕴涵 推理 任务 。 其 核心 问题 
是 计算 给 定 文档 问题 和 答案 之 间 的 语义 匹配 或 蕴涵 关系 。 传 统 方法 通常 着 眼 于 如 何 选 
取 或 设计 好 的 文本 、 语 义 等 特征 ,用 于 计算 它们 之 间 的 语义 相似 度 、 相 关 度 以 及 隐 含 的 逮 
辑 推理 关系 。 
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作为 比较 权威 的 MCTest 数据 集 的 发 布 者 ,Richardson 等 人 提出 了 两 种 非 监 督 阅读 
理解 基线 方法 。 这 两 种 方法 主要 用 文档 中 的 句子 和 问题 十 答案 组 成 的 句子 进行 语义 匹 
配 。 其 关键 核心 是 如 何 从 文本 中 提取 有 效 特 征 对 其 进行 语义 表示 。Richardson 提出 的 
第 一 种 方法 简单 采用 BOW 模型 ,其 首先 将 问题 和 某 个 候选 答案 拼接 在 一 起 ;然后 在 文档 
中 按照 与 问题 十 答案 相同 长 度 的 窗口 进行 滑动 ,并 将 窗口 含有 与 问题 十 答案 中 同样 的 词 
的 个 数 累 计 起 来 ,以 此 衡量 文本 与 问题 十 答案 的 语义 匹配 程度 。 第 二 种 方法 是 第 一 种 方 
法 的 扩展 ,主要 是 去 掉 停 词 和 问 句 的 影响 。 虽然 这 两 种 方法 比较 简单 ,但 是 在 
MCTest160 和 MCTest500 上 面 取得 了 非常 不 错 的 效果 。 

Sachan 等 人 把 阅读 理解 看 成 一 种 由 背景 文档 到 答案 和 问题 组 成 的 statement( 即 陈 
述 句 ) 的 推理 任务 。 该 方法 首先 将 问题 答案 组 合成 statement, 然 后 看 文章 中 的 文本 片段 
是 否 列 涵 这 个 statement。 这 是 一 种 标准 的 文本 蕴涵 推理 (Recognizing Textual 
Entailment,RTE) 过 程 , 即 给 定 两 句 话 或 者 两 段 文本 ,判断 这 两 句 话 或 者 两 段 文本 之 间 有 
没有 蕴涵 、 对 立 或 者 不 相关 的 关系 。 和 以 往 的 RTE 任务 不 同 ,这 里 需要 将 整个 文档 考虑 
进去 ,不 仅仅 是 单 句子 ,而 是 多 句子 的 蕴涵 推理 ,其 核心 问题 在 于 文档 中 与 问题 相关 的 句 
子 不 一 定 是 连续 的 。 为 了 将 文档 中 各 个 不 一 定 连续 的 句子 有 机 组 合 在 一 起 ,作者 使 用 了 
修辞 结构 理论 (Rhetorical Structure Theory，RST) 以 及 事件 实体 共 指 方法 对 多 句子 进行 
建 模 。 其 主要 目标 是 将 文档 中 各 个 独立 的 部 分 (不 一 定 是 句子 ) 依 靠 其 在 文中 的 作用 ,以 
及 和 其 他 元 素 之 间 的 关系 将 其 结合 起 来 形成 统一 的 层次 架构 。 依 靠 RST, 我 们 就 可 以 在 
文档 中 获得 相应 的 关联 部 分 ,并 将 这 些 关 联 部 分 组 合 起 来 ,和 问题 十 答案 组 成 的 
statement 候选 进行 对 齐 ,进而 判别 文档 和 statement 之 间 是 否 存在 蕴涵 关系 ,其 中 一 个 
对 章 的 例子 如 图 8-18 所 示 。 


elaboration 





(Question: What did Alyssa eat at the restaurant?Answer Candidate: Catfish) 


图 8-18 文档 与 statement 的 对 齐 


从 这 个 句子 中 可 以 看 到 ,该 方法 通过 RST 技术 可 以 将 文本 中 相关 联 的 两 句 找到 (图 
中 的 省 略 号 两 边 代表 两 句 话 ) ,通过 RST 可 以 判断 这 两 部 分 之 间 有 elaboration, 即 阐述 关 
系 。 然 后 根据 这 两 个 单元 ,以 及 上 一 步 生成 的 陈述 句 (假设 ) ,学 习 一 种 隐 含 的 结构 化 对 齐 
(图 8-18 中 实 线 表示 )。 在 这 篇 文章 中 ,作者 使 用 的 是 一 种 叫 作 潜 在 结构 支持 向 量 机 
(Latent Structural SVM，LSSVMD) 的 算法 自动 学 习 这 种 隐 含 联系 。 

传统 特征 工程 的 方法 旨 在 用 一 些 自然 语言 处 理工 具 提取 语言 学 特征 ,然后 根据 这 些 
语言 学 特征 比较 答案 和 文档 的 相似 度 。 这 种 方法 解释 性 很 强 , 每 一 部 分 的 结果 都 能 直观 
地 展现 出 来 。 但 是 ,这 类 方法 需要 大 量 精心 构建 的 特征 ,而 且 取得 的 效果 较 非 监督 的 词 项 
匹配 的 方法 提升 并 不 是 很 明显 。 另 外 ,阅读 理解 任务 需要 我 们 对 文档 中 的 深层 次 语义 进 
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行 建 模 ,而 现 有 特征 工程 的 方法 往往 只 能 或 多 或 少 地 考虑 其 中 一 小 部 分 。 

2. 基于 深度 学 习 的 机 器 阅读 理解 方法 

随 着 深度 神经 网 络 在 很 多 人 工 智能 以 及 自然 语言 处 理 任务 上 得 到 有 效应 用 ,并 已 经 
取得 了 很 好 的 效果 ,如 问答 系统 、 关 系 分 类 、 目 标 检测 、 语 音 识别 等 , 越 来 越 多 的 研究 者 也 
已 经 开始 关注 基于 深度 神经 网 络 的 机 器 阅读 理解 方法 。 基 于 深度 学 习 的 机 器 阅读 理解 方 
法 试图 建立 一 套 " 端 到 端的 网 络 模型 ,不 像 传统 阅读 理解 方法 的 Pipeline 的 处 理 策略 ,这 
类 方法 将 所 有 的 阅读 理解 步骤 都 建 模 在 统一 的 学 习 框 架 中 ,试图 基于 已 标注 的 训练 语 料 ， 
自动 学 习 文本 的 语义 表示 .语义 组 合 过 程 以 及 问答 的 过 程 。 其 中 最 具 代 表 性 的 模型 就 是 
记忆 网 络 (memory network ) 。 

记忆 网 络 的 核心 是 记忆 模块 ,可 以 看 作 是 一 个 知识 存储 器 。 在 学 习 的 过 程 中 ,首先 需 
要 对 这 个 存储 器 的 内 容 进 行 插入 或 更 新 ,然后 在 测试 时 依靠 这 个 存储 器 中 的 信息 对 答案 
进行 推理 判断 。 具 体 地 ,记忆 网 络 包 含 下 面 4 个 主要 模块 。 

I: 输入 特征 映射 一 一 将 输入 转换 为 内 部 特征 表示 。 

G: 泛 化 一 一 得 到 新 的 输入 时 对 过 去 的 记忆 进行 更 新 。 称 这 步 为 泛 化 的 原因 是 ,在 
整个 过 程 中 ,网 络 能 够 根据 未 来 的 某 些 特定 需要 压缩 ` 泛 化 本 身 的 记忆 。 

O: 输出 特征 映射 一 一 根据 当前 的 输入 和 记忆 状态 得 到 输出 (这 一 步 的 输出 是 内 部 
特征 表示 的 形式 ) 。 

R: 响应 一 一 将 上 一 步 中 的 输出 转换 为 指定 的 响应 格式 。 

举例 来 说 ,对 于 一 个 特定 的 输入 ,模型 会 按照 以 下 步骤 执行 操作 : 四 将 转换 为 内 部 特 
征 表示 的 形式 ; @ 根 据 输 入 更 新 记忆 : 四 根据 输入 和 记忆 计算 输出 特征 ; @ 最 后 解码 得 
到 响应 结果 。 对 于 特定 的 任务 来 说 ,每 个 组 件 都 能 够 设计 成 不 同 的 函数 。 

基于 深度 学 习 的 方法 主要 依靠 神经 网 络 对 文档 和 问题 以 及 答案 进行 表示 ,然后 再 比 
较 语义 相似 度 。 





8.9.3 机 器 阅读 理解 研究 展望 


2017 年 ,微软 亚洲 研究 院 周明 在 文章 “深度 学 习 在 自然 语言 处 理 领域 的 最 新 进展 ”中介 
绍 了 该 研究 院 的 成 果 :“ 斯 坦 福 大 学 做 了 一 个 阅读 理解 测试 题 并 于 2016 年 9 月 上 线 。 它 提 
供 了 一 定 规模 的 训练 集 、 开 发 集 和 测试 集 。 该 任务 的 答案 基本 都 在 文中 出 现 过 ,需要 找 出 答 
案 候选 ,然后 经 排序 输出 一 个 最 好 的 答案 。 参 赛 队 伍 把 用 训练 集训 练 的 系统 提交 给 斯 坦 福 
大 学 后 ,由 它 运行 你 的 系统 ,然后 在 其 网 站 上 发 表 测试 结果 。 提 交 的 结果 包含 单 系统 和 多 系 
统 融 合 的 结果 。 我 们 的 工作 比较 幸运 ,无 论 是 单 系统 ,还 是 多 系统 ,都 一 直 位 居所 有 参赛 队 
伍 的 第 一 名 。 我 们 的 系统 融合 的 结果 目前 能 做 到 76 分 左右 ,而 斯 坦 福 大 学 雇 人 做 题 的 正确 
率 可 达 81% ,可见 针对 这 个 阅读 理解 任务 ,计算 机 和 人 还 有 5 分 的 差距 。” 

机 器 阅读 理解 的 研究 未 来 有 3 方面 值得 关注 。 

第 一 ,首先 从 统计 的 角度 分 析 , 现 有 针对 问答 系统 的 深度 学 习 技术 (如 记忆 网 络 、 神 经 
图 灵机 、 关 注 模型 ) 都 是 需要 大 量 数 据 才 能 很 好 地 训练 的 ,如 果 把 阅读 理解 过 程 当 成 一 个 
非常 复杂 的 函数 ,这 个 函数 实现 从 文本 (函数 自 变量 ) 到 知识 (函数 因 变量 ) 的 映射 ,由 于 映 
射 过 程 复杂 , 值 域 定义 域 非常 大 ,所 以 , 想 通 过 数据 对 这 个 函数 进行 拟 合 (深度 神经 网 络 的 
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训练 过 程 ) ,需要 大 量 数据 才能 完成 。 如 何 利 用 现 有 的 含有 不 同 语义 特征 的 语言 学 资源 帮 
助 完 成 阅读 理解 任务 ,使 现 有 的 神经 网 络 方法 能 够 很 好 地 展现 其 能 力 , 是 未 来 阅读 理解 研 
究 的 一 个 重要 方向 。 

第 二 ,从 逻辑 的 角度 看 ,对 过 程 进行 建 模 如 果 从 统计 的 角度 , 则 需要 大 数据 ,而 通过 风 
辑 的 角度 , 则 是 一 条 条 规则 。 如 何 依靠 数据 对 规则 进行 建 模 是 一 个 非常 期 待 的 研究 方向 。 
现在 的 马尔 可 夫人 逻辑 网 ,概率 软 逻 辑 在 这 一 方面 展现 了 很 好 的 性 能 ,但 是 ,由 于 这 些 工作 
的 基本 单元 还 是 符号 规则 ,因而 应 用 性 还 是 不 高 。 如 何 将 最 基本 的 规则 单元 从 符号 转换 
到 连续 数值 空间 ,使 之 有 更 强 的 鲁 棒 性 和 数据 驱动 性 则 是 一 个 或 待 解决 的 问题 。 

第 三 , 现 有 的 深度 学 习 方 法 往往 着 重 于 句子 整体 的 语义 ,实行 端 对 端的 训练 ,这 种 方 
式 简单 ,但 可 解释 性 差 , 内 部 机 制 还 难以 理解 。 那 么 ,我 们 是 不 是 可 以 把 阅读 理解 “推理 
任务 拆 分 开 , 把 整个 文本 理解 过 程 当 作 很 多 更 细 粒 度 的 语义 分 析 过 程 的 集合 ,然后 对 每 一 
个 子 部 分 进行 建 模 。 最 后 将 这 些 子 过 程 有 机 结合 在 一 起 ,组 成 最 后 的 理解 过 程 ,是 不 是 会 
有 更 好 的 效果 和 更 好 的 解释 性 。 


8.10 机 器 写作 


机 器 写作 (又 称 自然 语言 生成 ) 是 自然 语言 处 理 领域 的 重要 研究 方向 之 一 ,也 是 近期 
的 研究 热点 。 我 们 希望 计算 机 同时 具有 读 与 写 的 能 力 , 除 了 掌握 阅读 和 理解 语言 文字 的 
本 领 外 ,还 能 够 掌握 文字 创作 的 本 领 ,从 而 像 人 类 一 样 写 出 高 质量 的 各 类 文字 作品 ,如 新 
闻 资 讯 .报告 .诗歌 .小 说 、 作 文 等 。 

机 器 写作 在 传媒 、 出 版 文娱、 广告 等 多 个 行业 均 具 有 广阔 的 应 用 场景 。 欧美 等 地 较 
早 就 创建 了 多 家 专注 于 机 器 写作 、 技 术 应 用 的 公司 ,如 ARRIA、AI、Narrative Science 等 ， 
这 些 公司 基于 行业 数据 生成 行业 报告 或 新 闻 报 道 , 从 而 节省 了 大 量 的 人 力 。 同 时 ,不 少 国 
外 知名 媒体 单位 纷纷 采用 机 器 写作 技术 进行 新 闻 稿 件 创作 ,替代 编辑 与 记者 的 部 分 工作 。 
例如 ,2006 年 ,美国 汤姆 森 公 司 开始 用 机 器 人 撰写 金融 新 闻 ,2014 年 , 美 联 社 全 面 利用 机 
器 人 WordSmithCAI 公司 的 写作 引擎 ) 进 行 写 作 。 近 几 年 ,机 器 写作 在 国内 也 逐渐 受到 业 
界 的 重视 ,包括 今日 头条 、 腾 讯 .百度 .360 等 各 大 互联 网 公司 以 及 新 华 社 、 南 方 都 市 报 、 第 
一 财经 等 传统 媒体 单位 均 开展 了 机 器 写作 技术 的 研究 与 应 用 。 他 们 推出 了 
Xiaomingbot、DreamWriter, 快 笔 小 新 .小南 .DT 稿 王 等 多 款 写 作 ( 写 稿 ) 机 器 人 。 其 中 ， 
Xiaomingbot 是 北京 大 学 计算 机 所 与 今日 头条 在 2016 年 7 月 联合 推出 的 写 稿 机 器 人 。 
它 能 够 针对 各 类 体育 赛事 撰写 稿件 ,包括 短篇 消息 与 长 篇 通信 ,目前 累计 撰写 的 新 闻 稿 件 
已 达 万 篇 ,获得 数 千 万 的 阅读 量 。 

上 述 应 用 表明 ,机 器 写作 不 再 属于 纸上谈兵 ,而 是 已 经 对 人 类 工作 和 生活 产生 了 重大 
影响 。 与 人 类 作者 相 比 ,机 器 写作 具有 效率 高 、 实 时 性 好 、 覆 盖 性 强 .无 偏见 等 优点 ,同时 ， 
据 今 日 头条 的 线 上 测试 表明 ,机 器 人 撰写 的 新 闻 稿件 的 阅读 率 与 人 工 稿件 的 阅读 率 基本 
相同 ,这 说 明 机 器 稿件 的 质量 是 不 错 的 ,能 够 被 广大 用 户 接受 。 

计算 机 不 能 凭空 写作 ,必须 根据 所 输入 的 数据 与 素材 进行 创作 。 根 据 不 同类 型 的 输 
入 ,计算 机 一 般 采 用 不 同 的 写作 方式 进行 创作 ,如 原创 、 二 次 创作 和 混合 创作 。 混 合 创作 
是 指 计算 机 结合 原创 与 二 次 创作 两 种 方式 进行 文字 创作 ,稿件 中 的 一 部 分 内 容 从 结构 化 
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数据 中 直接 生成 ,而 另 一 部 分 内 容 则 从 已 有 文本 中 进行 提炼 或 改写 得 到 。 混 合 创作 能 够 
生成 内 容 更 加 丰富 、 形 式 更 加 多 样 的 文本 。 





8.10.1 机 器 原创 稿件 


计算 机 根据 输入 的 结构 化 数据 (如 报表 、RDF 数据 等 ) 进 行文 字 创 作 。 该 方式 能 够 生 
成 原创 稿件 ,是 目前 机 器 写作 的 主要 方式 ,适用 于 天 气 预报 、 医 疗 报告 .赛事 简讯 .财经 报 


道 等 文本 的 生成 。 
数据 到 文本 的 生成 系统 的 一 般 框 架 如 图 8-19 所 示 。 该 框架 由 英国 阿 伯 丁 大 学 Ehud 
Reiter 在 三 阶段 流水 线 模型 的 基础 上 提出 。 其 中 ,信号 分 输入 数据 
析 模 块 通过 利用 各 种 数据 分 析 方 法 检测 输入 数据 的 基本 输入 事件 | 
模式 ,输出 离散 数据 模式 ;数据 阐释 模块 通过 对 基本 模式 信号 分 析 模块 
和 输入 事件 进行 分 析 , 推 断 出 更 加 复杂 和 抽象 的 消息 , 同 模式 
时 推断 出 它们 之 间 的 关系 ,之 后 输出 高 层 消息 以 及 消息 之 1 
间 的 关系 ;文档 规划 模块 分 析 决 定 哪些 消息 和 关系 需要 在 数据 闹 释 模 块 


文本 中 提 及 ,同时 确定 文本 的 结构 ,最 后 输出 需要 提 及 的 


消息 以 及 文档 结构 ; 微 规划 与 实现 模块 根据 选中 的 消息 及 Le 天 
结构 通过 自然 语言 生成 技术 输出 最 终 的 文本 ,主要 涉及 对 文档 规划 模块 
句子 进行 规划 以 及 句子 实现 ,最 终 实现 的 句子 具有 正确 的 选中 的 清二， 
语法 .形态 和 拼写 ,同时 采用 准确 的 指 代 表达 。 文本 结构 





实际 月 ,可 习 制作 和 填充 的 方式 实 1 
在 实际 应 用 中 ,可 采用 模板 制作 和 填充 的 方式 实现 人 珊 旭 与 实现 模 闫 


数据 到 文本 的 生成 。 模 板 制 作 依赖 于 领域 专家 的 写作 经 1 

验 , 或 者 从 大 量 平行 语 料 中 进行 模板 的 自动 学 习 与 归纳 。 文本 

一 旦 模板 制作 完成 ,稿件 的 写作 过 程 就 很 简单 ,只 将 相关 ”图 8-19 数据 到 文本 的 生成 
数据 填充 到 模板 中 即 可 。 这 种 方式 生成 的 稿件 准确 性 系统 的 一 般 框架 


高 ,可 读 性 强 ; 然 而 ,由 于 模板 比较 固定 ,所 以 生成 稿件 的 
模式 基本 相同 ,多 样 性 较 差 。 当 然 ,如 果 模 板 库 足 够 丰富 ,稿件 多 样 性 少 的 问题 也 可 以 得 
到 解决 ,但 制作 模板 比较 耗 时 、 耗 力 。 另 一 个 严重 的 问题 在 于 ,不 同 领域 的 机 器 写作 依赖 
于 不 同 的 数据 和 不 同 的 模板 ,而 模板 的 领域 迁移 性 很 差 ,这 也 导致 目前 机 器 写作 应 用 难以 
实现 跨 领 域 迁移 ,面向 新 领域 需要 二 次 开发 。 

基于 深度 学 习 技术 进行 数据 到 文本 的 生成 则 不 依赖 于 模板 或 规则 ,而 是 直接 基于 平 
行 语 料 学 习 得 到 端 到 端的 生成 模型 。 然 而 ,这 样 的 写作 方式 虽然 在 研究 上 取得 了 一 定 的 
进展 ,但 目前 并 不 能 保证 所 生成 稿件 的 准确 性 与 可 读 性 ,难以 达到 对 稿件 的 高 质量 要 求 。 
此 外 ,基于 深度 学 习 的 生成 模型 需要 大 量 ( 一 般 数 万 以 上 ) 的 平行 语 料 ,而 目前 在 很 多 领域 
又 较 难 获取 。 


8.10.2 机 器 二 次 创作 


计算 机 根据 已 有 的 文字 素材 (如 已 经 发 表 的 新 闻 ) 进 行 二 次 文字 创作 。 该 方式 能 够 基 
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于 已 有 稿件 创作 出 不 一 样 的 稿件 。 例 如 ,为 一 篇 新 闻 生 成 摘要 ,对 多 篇 相关 新 闻 进 行 综 
述 , 对 一 篇 新 闻 进 行文 字 改写 等 。 

二 次 创作 主要 依赖 于 两 类 自然 语言 处 理 技术 : 自动 文摘 与 文本 复述 。 自 动 文摘 用 于 
对 单 篇 文本 或 多 篇 文本 进行 内 容 提炼 与 综合 ,形成 摘要 或 综述 。Xiaomingbot 写 稿 机 器 
人 就 利用 了 基于 机 器 学 习 的 自动 文摘 技术 对 平均 长 达 5000 字 的 赛事 直播 文字 进行 筛选 
与 融合 ,形成 长 达 千 字 的 赛事 报道 。 需 要 指出 的 是 ,多 文档 自动 文摘 比 单 文档 自动 文摘 更 
具有 挑战 性 ,原因 在 于 不 同文 档 内 容 的 宛 余 性 .片面 性 与 弱 连 贯 性 。 因 此 ,对 多 篇 新 闻 报 
道 进 行 长 篇 综述 的 生成 极其 困难 ,他 们 提出 基于 段落 排序 与 融合 的 方法 ,取得 了 一 定 的 效 
果 。 文 本 复述 则 用 于 对 现 有 文字 进行 改写 ,在 主题 与 意思 基本 不 变 的 前 提 下 产生 另 一 种 
文字 表述 ,从 而 避免 原文 照抄 ,也 可 达到 文本 风格 化 的 目的 。 例 如 ,可 以 将 规范 的 书面 用 
语 改写 为 活泼 的 网 络 用 语 。 可 以 将 文本 复述 看 作 是 一 种 单 语言 机 器 翻译 问题 ,因此 在 平 
行 语 料 充足 的 前 提 下 ,各 种 统计 机 器 翻译 方法 (包括 神经 网 络 机 器 翻译 ) 均 可 应 用 于 此 。 
但 现实 中 却 难 以 获得 大 规模 的 此 类 平行 语 料 , 因 此 ,针对 文本 复述 的 研究 需要 另 尽 蹊 径 ， 
最 新 的 研究 主要 集中 在 如 何 有 效 地 利用 少量 的 平行 语 料 和 大 规模 的 非 平行 语 料 进行 复述 
模型 的 学 习 。 

现 有 的 自动 文摘 方法 概括 为 4 种 : 自动 摘录 、 基 于 理解 的 自动 文摘 、 信 息 抽 取 和 基于 
结构 的 自动 文摘 。 

1. 自动 摘录 

将 文本 视 为 句子 的 线性 序列 ,将 句子 视 为 词 的 线性 序列 。 具 体 分 4 步 进行 : 计算 
词 的 权 值 ; @ 计 算 句 子 的 权 值 ; 四 对 所 有 句子 按 权 值 高 低 降 序 排列 , 权 值 最 高 的 若干 名 
子 被 确定 为 文摘 句 ; 图 将 文摘 句 按照 它们 在 原文 中 的 出 现 顺序 输出 。 计 算 权 值 的 依据 是 
文本 的 6 种 特征 : 词 频 \ 标 题 ` 位 置 . 句 法 结构 .线索 词 和 指示 性 短语 。 

2. 基于 理解 的 自动 文摘 

不 仅 利用 语言 学 知识 获取 语言 结构 ,还 利用 领域 知识 进行 判断 推理 ,得 到 文摘 的 意义 
表示 并 生成 摘要 。 基 本 步骤 包括 : 语法 分 析 、 语 义 分 析 、 语 用 分 析 和 信息 提取 ,文本 生成 。 
篇 童 意义 是 原文 分 析 的 结果 和 文摘 生成 的 依据 ,用 脚本 、 概 念 从 属 结构 ,框架 ,一 阶 谓词 逻 
辑 等 表示 。 

3. 信息 抽取 

以 文摘 框架 为 中 枢 ,分 为 选择 与 生成 两 个 阶段 。 文 摘 框 架 是 一 张 申请 单 , 它 以 空 槽 的 
形式 提出 应 从 原文 中 获取 的 各 项 内 容 。 在 选择 阶段 利用 特征 词 从 文本 中 抽取 相关 的 短语 
或 句子 填充 文摘 框架 ,在 生成 阶段 利用 文摘 模板 将 文摘 框架 中 的 内 容 转 换 为 文摘 输出 。 
文摘 模板 是 带 有 空白 部 分 的 现成 的 套话 ,其 空白 部 分 与 文摘 框架 中 的 空 槽 对 应 。 

由 于 文摘 框架 的 编写 完全 依赖 于 领域 知识 ,必须 为 每 个 领域 都 编写 一 个 文摘 框架 , 先 
进行 主题 识别 ,根据 主题 调用 相应 的 文摘 框架 。 

4. 基于 结构 的 自动 文摘 

篇 章 是 有 机 的 结构 体 , 其 中 的 不 同 部 分 承担 着 不 同 的 功能 ,彼此 存在 错综复杂 的 关 
系 。 通 过 分 析 篇 章 结构 找 出 核心 部 分 。 但 是 ,语言 学 对 于 篇 章 结构 的 研究 还 很 不 够 ,可 用 
的 形式 规则 更 少 ,这 使 得 基于 结构 的 自动 文摘 还 没有 一 套 成 熟 的 方法 ,不 同学 者 用 来 识别 
篇 章 结构 的 手段 也 有 很 大 差别 。 它 更 符合 科技 文献 文摘 编写 的 标准 。 
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8.10.3 机 器 写作 展望 


机 器 写作 无 论 是 在 研究 上 ,还 是 在 应 用 上 ,都 取得 了 明显 的 进展 ,但 也 面临 不 少 困难 。 
除了 上 文 提 到 的 平行 语 料 缺乏 、 领 域 迁移 性 差 等 问题 之 外 ,还 存在 难以 客观 评价 的 问题 。 
目前 ,机 器 写作 的 客观 评价 指标 一 般 为 BLEU 和 ROUGE, 这 两 个 指标 用 来 计算 生成 文 
本 与 参照 文本 之 间 的 词语 重 全 程度。 然而 ,文章 的 写作 方式 可 以 有 干 万 种 ,每 个 作者 都 可 
以 根据 同一 命题 写 出 内 容 不 一 样 但 质量 都 很 高 的 文章 。 那 么 ,目前 为 生成 文本 只 提供 一 
两 个 参照 文本 的 评价 方式 显然 不 合理 ,但 现实 却 又 只 能 如 此 。 当 然 ,我们 可 以 采用 人 工 进 
行 主观 评价 ,然而 人 工 评价 耗 时 、 耗 力 ,同时 会 受到 外 在 因素 的 干扰 。 因 此 ,未 来 有 必要 设 
计 更 合理 的 客观 评价 指标 ,这 对 机 器 写作 领域 的 发 展会 起 到 不 可 估量 的 推动 作用 。 

机 器 写作 除了 用 于 撰写 新 闻 、 报 告 等 应 用 型 文本 外 , 近 几 年 还 被 用 于 创作 古诗 、 现 代 
诗 ,散文 等 文学 作品 ,如 微软 小 冰 、 清 华 九 歌 等 系统 ,能 够 分 别 创作 现代 诗 和 古诗 ,在 文字 
形式 上 的 总 体 效果 还 是 不 错 的 ,但 在 意境 上 有 所 欠缺 。 我 们 也 尝试 了 基于 自动 文摘 的 方 
式 进行 散文 的 自动 拼凑”, 经 中 学 教师 评分 能 够 取得 不 错 的 分 数 。 

在 未 来 几 年 ,机 器 写作 将 在 更 多 行业 和 领域 得 到 应 用 ,从 而 节省 大 量 的 人 力 ,体现 更 
大 的 价值 。 同 时 , 随 着 数据 的 逐步 累积 和 模型 的 逐步 完善 ,基于 深度 学 习 的 机 器 写作 将 会 
取得 显著 的 进展 。 


8.11 聊天 机 器 人 


目前 的 人 机 对 话 系统 大 致 可 以 分 为 两 类 : 一 类 是 面向 特定 任务 的 ; 另 一 类 是 开放 性 
的 ,系统 没有 特定 的 任务 要 求 , 也 称 聊 天 系统 。 

北京 邮电 大 学 智能 科学 与 技术 中 心 研 制 的 会 议 室 预定 系统 (Meeting Room Booking 
System,MRBS) 是 面向 特定 任务 的 系统 。 在 该 系统 中 ,机 器 通过 与 用 户 对 话 获取 用 户 要 
预定 的 会 议 室 的 时 间 ,大 小 人数、 价格 等 信息 。 目 前 , 仅 从 对 话 系统 获取 任务 相关 信息 的 
角度 看 ,针对 特定 任务 的 对 话 系统 可 以 达到 较 好 的 性 能 。 图 8-20 是 MRBS 人 机 对 话 系 
统 的 对 话 片段 。 

















User: ”我 想 在 北京 找 一 个 300 人 的 会 议 室 。 
MRBS: “有 300 人 在 北京 开 的 会 议 ， 对 吗 ? 
User: 嗯 ， 对 的 。 

MRBS : ”还 有 其 他 需求 吗 ? 

User: ”下 周三 开会 . 

MRBS : ”日 期 初步 定 在 下 周三 ， 要 开 多 长 时 间 呢 ? 
User: “还 是 下 周 五 吧 ， 开 两 天 。 

MRBS : “是 下 周 五 开 ， 开 两 天 ， 您 预算 多 少 呢 ? 


图 8-20 MRBS 人 机 对 话 系统 的 对 话 片段 


聊天 机 器 人 是 一 种 通过 自然 语言 模拟 人 类 进行 对 话 的 程序 ,通常 运行 在 特定 的 软件 
平台 上 ,如 PC 平台 或 者 移动 终端 设备 平台 ,而 类 人 的 硬件 机 械 体 则 不 是 必需 的 承载 
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设备 。 

为 了 将 图 灵 测 试 付 诸 实 践 ,美国 科学 家 兼 慈善 家 Hugh G. Loebner 于 1990 年 设立 
了 人 工 智能 年 度 比 赛 一 一 和 勒 布 纳 奖 (Loebner Prize) 。 勒 布 纳 奖 的 设立 旨 在 奖励 首 个 与 人 
类 回复 无 差别 的 计算 机 程序 , 即 聊 天 机 器 人 系统 ,并 以 此 推动 图 录 测 试 及 人 工 智能 的 
发 展 。 

在 勒 布 纳 奖 的 推动 下 ,聊天 机 器 人 的 研究 迎 来 了 一 个 高 潮 , 这 里 较为 代表 性 的 聊天 机 
器 人 系统 是 ALICE (Artificial Linguistic Internet Computer Entity)。 Richard S. 
Wallace 博士 在 1995 年 开发 了 ALICE 系统 。ALICE 曾经 在 2000 年 .2001 年 和 2004 年 
3 次 问 易 勒 布 纳 奖 。 尽 管 ALICE 采用 的 是 启发 式 模板 匹配 的 对 话 策略 ,但 是 它 仍 然 被 认 
为 是 同类 型 聊天 机 器 人 中 性 能 最 好 的 系统 之 一 。 

微软 公司 推出 了 基于 情感 计算 的 聊天 机 器 人 “小 冰 ”, 百 度 推 出 了 用 于 交互 式 搜 索 的 
聊天 机 器 人 “小 度 ”, 进 而 推动 了 聊天 机 器 人 产品 化 的 发 展 。 


8.11.1 聊天 机 器 人 应 用 场景 


近年 来 ,基于 聊天 机 器 人 系统 的 应 用 层出不穷 。 从 应 用 场景 的 角度 看 ,可 以 分 为 在 线 
客服 娱乐 教育、 个 人 助理 和 智能 问答 5 个 种 类 。 

在 线 客服 聊天 机 器 人 系统 的 主要 功能 是 同 用 户 进行 基本 沟通 ,并 自动 回复 用 户 有 关 
产品 或 服务 的 问题 ,以 实现 降低 企业 客服 运营 成 本 、 提 升 用 户 体验 的 目的 。 其 应 用 场景 通 
常 为 网 站 首页 和 手机 终端 。 代 表 性 的 商用 系统 有 小 工 机 器 人 、 京 东 的 JIMI 客服 机 器 人 
等 。 用 户 可 以 通过 与 JIMI 聊天 了 解 商品 的 具体 信息 以 及 反馈 购物 中 存在 的 问题 等 。 值 
得 称赞 的 是 ,JIMI 具备 一 定 的 拒 识 能 力 , 即 能 够 知道 自己 不 能 回答 用 户 的 哪些 问题 以 及 
何 时 应 该 转向 人 工 客服 。 

娱乐 场景 下 聊天 机 器 人 系统 的 主要 功能 是 同 用 户 进 行 开 放 主 题 的 对 话 ,从 而 实现 对 
用 户 的 精神 陪伴 ,情感 慰藉 和 心理 朴 导 等 作用 。 其 应 用 场景 通常 为 社交 媒体 ,儿童 玩具 
等 。 代 表 性 的 系统 如 微软 “小 冰 ”、 微 信 *“ 小 微 *“ 小 黄 鸡 “爱情 玩偶 ”等 。 其 中 ,微软 “小 冰 ” 
和 微 信 “小 微 " 除 了 能 够 与 用 户 进 行 开放 主题 的 聊天 之 外 ,还 能 提供 特定 主题 的 服务 ,如 天 
气 预 报 和 生活 常识 等 。 

应 用 于 教育 场景 下 的 聊天 机 器 人 系统 根据 教育 的 内 容 不 同 包括 构建 交互 式 的 语言 
用 环境 ,帮助 用 户 学 习 某 种 语言 ;在 学 习 某 项 专业 技能 中 ,指导 用 户 逐 步 深 入 地 学 习 并 掌 
握 该 技能 ;在 用 户 的 特定 年 龄 阶段 ,帮助 用 户 进行 某 种 知识 的 辅助 学 习 等 。 其 应 用 场景 通 
常 为 具备 人 机 交互 功能 的 学 习 、 培 训 类 软件 以 及 智能 玩具 等 ,如 科大 讯 飞 公司 开发 的 智能 
玩具 “ 熊 宝 ”可 以 通过 语音 对 话 的 形式 辅助 儿童 学 习 唐 诗 、 宋 词 以 及 回答 简单 的 常识 性 问 
题 等 。 

个 人 助理 类 应 用 主要 通过 语音 或 文字 与 聊天 机 器 人 系统 进行 交互 ,实现 个 人 事务 的 
查询 及 代办 功能 ,如 天 气 查 询 .空气 质量 查询 .定位 短信 收发 .日 程 提醒 、 智 能 搜索 等 ,从 
而 更 便捷 地 辅助 用 户 的 日 常事 务 处 理 。 其 应 用 场景 通常 为 便携 式 移动 终端 设备 。 代 表 性 
的 商业 系统 有 Apple Siri、Google Now、 微 软 Cortana 出门 问 问 等 。 其 中 ,Apple Siri 的 出 
现 引领 了 移动 终端 个 人 事务 助理 应 用 的 商业 化 发 展 潮流 。Apple Siri 随 着 iOS 5 一 同 发 





务 8 葛 自然 语言 处 理 蕉 太一 一 461 


布 ,具备 聊天 和 指令 执行 功能 ,可 以 视 为 移动 终端 应 用 的 总 入 口 。 然 而 ,受到 语音 识别 能 
力 、 系 统 本 身 自然 语言 理解 能 力 的 不 足以 及 用 户 使 用 语音 和 UTI 操作 两 种 形式 进行 人 机 
交互 时 的 习惯 差异 等 限制 ,Siri 没 能 真正 担负 起 个 人 事务 助理 的 重任 。 

智能 问答 类 的 聊天 机 器 人 的 主要 功能 包括 回答 用 户 以 自然 语言 形式 提出 的 事实 型 问 
题 和 需要 计算 和 修 辑 推理 型 的 问题 ,以 达到 直接 满足 用 户 的 信息 需求 及 辅助 用 户 进行 决 
策 的 目的 。 其 应 用 场景 通常 作为 问答 服务 整合 到 聊天 机 器 人 系统 中 。 典 型 的 智能 问答 系 
统 除了 IBM Watson 之 外 ,还 有 Wolfram Alpha 和 Magi, 后 两 者 都 是 基于 结构 化 知识 库 
的 问答 系统 , 且 分 别 仅 支持 英文 和 中 文 的 问答 。 

聊天 机 器 人 的 研究 主要 有 3 部 分 内 容 : 单 轮 聊天 多 轮 聊 天 以 及 个 性 化 聊天 。 单 轮 
聊天 研究 的 是 如 何 针对 当前 输入 信息 给 出 回复 。 这 是 聊天 机 器 人 研究 中 最 基本 的 问题 ， 
也 是 构建 聊天 机 器 人 首先 要 解决 的 问题 。 多 轮 聊 天 是 研究 如 何在 回复 过 程 中 考虑 上 下 文 
信息 。 这 个 问题 不 仅 在 聊天 机 器 人 中 ,在 任何 对 话 系统 的 研究 中 都 是 本 质问 题 。 由 于 对 
话 上 下 文 每 一 句 都 很 短 ,而 且 不 同上 下 文 语 境 间 没有 明显 的 边界 ,也 没有 大 规模 的 标注 语 
料 , 上 下 文 分 析 ( 特 别 是 聊天 机 器 人 中 针对 开放 域 对 话 的 上 下 文 分析 ) 一 直 是 一 个 难点 。 
个 性 化 聊天 是 要 让 聊天 机 器 人 可 以 根据 用 户 的 喜好 以 及 当前 的 情绪 等 给 出 不 同 的 回复 。 
这 是 聊天 机 器 人 对 话 中 独 有 的 问题 ,目的 是 提高 用 户 对 聊天 机 器 人 ”陪伴 ?角色 的 认可 度 ， 
从 而 增加 用 户 黏 性 。 





8.11.2 聊天 机 器 人 系统 的 组 成 结构 及 关键 技术 


通常 ,聊天 机 器 人 的 系统 框架 如 图 8-21 所 示 ,包含 5 个 主要 的 功能 模块 。 语 音 识别 
模块 负责 接收 用 户 的 语音 输入 ,并 将 其 转换 成 文字 形式 交 由 自然 语言 理解 模块 进行 处 理 。 
自然 语言 理解 模块 在 理解 了 用 户 输入 的 语义 之 后 ,将 特定 的 语义 表达 式 输入 到 对 话 管理 
模块 中 。 对 话 管理 模块 负责 协调 各 个 模块 的 调用 及 维护 当前 对 话 状 态 ,选择 特定 的 回复 
方式 并 交 由 自然 语言 生成 模块 进行 处 理 。 自 然 语言 生成 模块 生成 回复 文本 输入 给 语音 合 
成 模块 ,将 文字 转换 成 语音 输出 给 用 户 。 这 里 仅 以 文本 输入 形式 为 例 介 绍 聊天 机 器 人 系 
统 , 语 音 识别 和 语音 合成 相关 技术 则 不 展开 介绍 。 





























上 1 
J 语音 识别 ”| 自然 语言 理解 
0 (ASR) 1 (NLU) 
| 1 对 话 
nl | 管理 
i 1 (DM) 
| 语音 合 | 自然 语言 生成 
| (TTS) 1 (NLG) 














图 8-21 聊天 机 器 人 的 系统 框架 
1. 自然 语言 理解 
自然 语言 理解 的 目的 是 为 聊天 任务 生成 一 种 语义 表示 形式 。 通 常 ,聊天 机 器 人 系统 
中 的 自然 语言 理解 功能 包括 用 户 意图 识别 ,用户 情 感 识别 、 指 代 消 解 、 省 略 恢复 .回复 确认 
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及 拒 识 判 断 等 技术 。 

(1) 用 户 意 图 识别 : 用 户 意图 又 包括 显 式 意 图 和 隐 式 意图 。 显 示意 图 通常 对 应 一 个 
明确 的 需求 ,如 用 户 输 入 “我 想 预 定 一 个 标准 间 ”, 明 确 表明 了 想 要 预订 房间 的 意图 ;而 隐 
式 意图 则 较 难 判断 ,如 用 户 输入 “我 的 手机 用 了 三 年 了 ”, 有 可 能 想 要 换 一 个 手机 或 者 显示 
其 手机 性 能 和 质量 良好 。 

(2) 用 户 情感 识别 : 用 户 情感 同样 也 包含 显 式 和 隐 式 两 种 ,如 用 户 输入 “我 今天 非常 
高 兴 ”, 明 确 表明 了 喜悦 的 情感 ;而 “今天 考试 刚刚 及 格 ” 则 不 太 容 易 判 断 用 户 的 情感 。 

(3) 指 代 消解 和 省 略 恢 复 : 在 对 话 过 程 中 ,由 于 人 们 之 间 具 备 聊天 主题 背景 一 致 性 
的 前 提 , 用 户 通常 使 用 代词 指 代 上 文中 的 某 个 实体 或 事件 ,或 者 干脆 省 略 一 部 分 句子 成 
分 。 但 对 于 聊天 机 器 人 系统 来 说 ,只 有 明确 了 代词 指 代 的 成 分 以 及 句子 中 省 略 的 成 分 , 才 
能 正确 理解 用 户 的 输入 ,给 出 合乎 上 下 文 语义 的 回复 。 因 此 ,需要 进行 代词 的 消解 和 省 略 
的 恢复 。 

(4) 回复 确认 : 用 户 意图 有 时 会 带 有 一 定 的 模糊 性 ,这 时 就 需要 系统 具有 主动 询问 
的 功能 ,进而 对 模糊 的 意图 进行 确认 , 即 回复 确认 。 

(5) 拒 识 判断 : 聊天 机 器 人 系统 应 当 具备 一 定 的 拒 识 能 力 ,主动 拒绝 识别 超出 自身 
回复 范围 之 外 或 者 涉及 敏感 话题 的 用 户 输入 。 

当然 ,词法 分 析 、 句 法 分 析 以 及 语义 分 析 等 基本 的 自然 语言 处 理 技术 ,对 于 聊天 机 器 
人 系统 中 的 自然 语言 理解 功能 也 起 到 了 至 关 重 要 的 作用 。 

2. 对 话 管理 

对 话 管理 功能 主要 协调 聊天 机 器 人 的 各 个 部 分 ,并 维护 对 话 的 结构 和 状态 。 对 话 管 
理 功 能 中 涉及 的 关键 技术 主要 有 对 话 行为 识别 .对 话 状 态 识别 .对 话 策略 学 习 及 对 话 奖 
励 等 。 

(1) 对 话 行为 识别 : 对 话 行为 是 指 预先 定义 或 者 动态 生成 的 对 话 意图 的 抽象 表示 形 
式 , 分 为 封闭 式 和 开放 式 两 种 。 所 谓 封闭 式 对 话 行为 ,即将 对 话 意图 映射 到 预先 定义 好 的 
对 话 行为 类 别 体系 ,常见 于 特定 领域 或 特定 任务 的 对 话 系统 ,如 票务 预订 酒店 预订 等 。 
例如 性 我 想 预订 一 个 标准 间 ”, 这 和 句 话 被 识别 为 Reservation(Standard_room) 的 对 话 行 
为 。 相 对 地 ,开放 式 对 话 行为 则 没有 预先 定义 好 的 对 话 行为 类 别 体系 ,对 话 行为 动态 生 
成 ,常见 于 开放 域 对 话 系统 ,如 聊天 机 器 人 。 例 如 ,今天 心情 真 好 啊 ”, 这 句 话 的 对 话 行为 
可 以 通过 隐 式 的 主题 .N 元 组 、 相 似 句子 簇 .连续 向 量 等 形式 表达 。 

(2) 对 话 状 态 识别 : 对 话 状态 与 对 话 的 时 序 及 对 话 行为 相关 联 , 在 : 时刻 的 对 话 行为 
序列 即 为 上 时 刻 的 对 话 状态 。 因 此 ,对 话 状态 的 转移 就 由 前 一 时 刻 的 对 话 状态 与 当前 时 
刻 的 对 话 行为 决定 。 

(3) 对 话 策略 学 习 : 通常 是 通过 离线 的 方式 ,从 人 一 人 对 话 数据 中 学 习 对 话 的 行为 、 
状态 ,流行 度 等 信息 ,从 而 作为 指导 人 一 机 对 话 的 策略 。 这 里 ,流行 度 通常 是 指 特定 模式 
在 语料库 中 的 频 度 。 

(4) 对 话 奖 励 : 是 对 话 系统 的 中 间 级 评价 机 制 ,但 会 影响 对 话 系统 的 整体 评价 。 常 
见 的 对 话 奖励 有 槽 填充 效率 和 回复 流行 度 等 。 

3. 自然 语言 生成 

自然 语言 生成 通常 根据 对 话 管理 部 分 产生 的 非 语 言 信息 ,自动 生成 面向 用 户 的 自然 
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语言 反馈 。 近 年 来 ,在 聊天 机 器 人 系统 上 的 对 话 生 成 主要 涉及 检索 式 和 生成 式 两 类 技术 。 

(1) 检索 式 对 话 生 成 技术 : 检索 式 的 代表 性 技术 是 在 已 有 的 人 一 人 对 话语 料 库 中 ， 
通过 排序 学 习 技术 和 深度 匹配 技术 找到 适合 当前 输入 的 最 佳 回复 。 这 种 方法 的 局 限 是 仅 
能 以 固定 的 语言 模式 进行 回复 ,无 法 实现 词语 的 多 样 性 组 合 。 

检索 式 聊天 机 器 人 需要 实现 线 上 和 线 下 两 部 分 。 线 下 部 分 由 3 个 模块 组 成 : 索引 、 
匹配 模型 以 及 排序 模型 。 这 3 个 模块 分 别 为 线 上 产生 回复 候选 ,信息 -回复 对 的 特征 描 
述 ,以 及 回复 候选 的 排序 。 索 引 中 收集 了 大 量 来 自 社交 网 络 上 人 与 人 的 交流 数据 ,组 织 成 
“一 问 一 答 ” 结 构 。 索 引 是 检索 式 聊天 机 器 人 的 基础 ,其 目的 是 当 线 上 来 了 一 个 用 户 的 信 
息 后 ,能 够 快速 从 大 量 * 问 答对 ”中 获得 可 能 的 回复 候选 。 匹 配 模型 是 检索 式 聊 天 机 器 人 
的 关键 ,其 作用 是 实现 对 用 户 信 息 和 回复 候选 的 语义 理解 ,对 二 者 语义 上 构成 回复 关系 的 
可 能 性 进行 打分 。 这 些 打分 在 线 上 构成 了 每 个 信息 -回复 对 的 特征 ,而 这 些 特征 最 终 由 一 
个 排序 模型 进行 整合 ,产生 最 终 的 候选 排序 。 机 器 人 最 后 的 回复 从 排 在 前 面 的 候选 中 
产生 。 

检索 式 聊天 机 器 人 很 大 程度 上 借鉴 并 沿用 了 搜索 引擎 的 架构 。 不 同 于 搜索 引擎 的 网 
页 搜索 ,聊天 机 器 人 在 回复 时 还 要 考虑 上 下 文 , 考 虑 当前 用 户 的 状态 (如 情绪 ) ,以 及 聊天 
机 器 人 自身 的 设 定 ( 如 是 男 , 是 女 ) ,有 什么 喜好 等 。 检 索 式 聊天 机 器 人 的 一 大 优势 在 于 ， 
上 下 文 信息 .用 户 情绪 理解 以 及 自身 设 定 等 都 可 以 通过 特征 的 方式 加 入 到 排序 中 。 例 如 ， 
在 考虑 上 下 文 的 时 候 ,一 般 是 把 一 定 长 度 的 上 下 文通 过 神经 网 络 变 成 向 量 ,然后 计算 这 些 
向 量 与 回复 候选 的 相似 度 ,并 将 相似 度 作为 特征 加 入 到 排序 模型 中 。 而 在 个 性 化 聊天 中 ， 
回复 候选 和 用 户 画 像 的 匹配 程度 也 可 以 作为 排序 特征 ,在 最 终 的 候选 排序 中 发 挥 作 用 。 
由 于 排序 学 习 算法 和 工具 在 搜索 引擎 的 发 展 过 程 中 已 经 非常 成 熟 ,检索 式 聊天 机 器 人 可 
以 利用 已 有 的 技术 简单 有 效 地 解决 这 些 问题 。 

(2) 生成 式 对 话 生成 技术 : 生成 式 的 代表 性 技术 则 是 从 已 有 的 人 -人 对 话 中 学 习 语言 
的 组 合 模式 ,是 通过 一 种 类 似 机 器 翻译 中 常用 的 “编码 一 解码 "的 过 程 去 逐 字 或 逐 词 地 生 
成 一 个 回复 ,这 种 回复 有 可 能 是 从 未 在 语料库 中 出 现 的 .由 聊天 机 器 人 自己 “创造 ?出 来 的 
句子 。 

生成 式 聊 天 机 器 人 的 原理 比较 简单 : 四 在 编码 阶段 ,利用 一 个 神经 网 络 ( 如 循环 神经 
网 络 ) 将 输入 信息 编码 成 向 量 ; @ 在 解码 阶段 ,以 编码 向 量 为 条 件 的 语言 模型 生成 可 能 的 
回复 。 这 个 语言 模型 通常 也 通过 循环 神经 网 络 实现 。 一 般 的 循环 神经 网 络 无 法 很 好 地 捕 
捉 到 词 与 词 之 间 长 距离 的 依赖 关系 ,因此 ,在 编码 一 解码 模型 的 实现 中 一 般 采 用 长 短期 记 
忆 单 元 或 者 门限 循环 单元 作为 循环 神经 网 络 的 实现 。 生 成 模型 由 于 其 特有 的 优势 ,被 认 
为 是 聊天 机 器 人 未 来 的 发 展 方向 ,同时 也 是 学 术 界 目前 关注 的 重点 。 

4. 基于 神经 符号 处 理 的 问答 系统 

近 几 年 ,基于 神经 符号 处 理 的 问答 系统 的 研究 有 了 很 大 突破 。 可 以 从 数据 出 发 ,完全 
端 到 端 地 构建 问答 系统 。 不 需要 人 工 干 预 , 只 提供 足够 量 的 训练 数据 。 问 答 的 准确 率 也 
有 了 一 定 的 提升 。 传 统 的 语义 分 析 技 术 被 颠覆 。 下 面 介 绍 几 个 有 代表 性 的 工作 。 

脸 书 (Facebook) 的 Weston 等 人 提出 了 记忆 网 络 (memory networks) 框 架 , 可 用 于 如 
下 场景 的 问答 。 

John is in the playground. 
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Bob is in the office. 

John picked up the football. 

Bob went to the kitchen. 

Q: where is the football? 

A: playground. 

记忆 网 络 由 神经 网 络 和 长 期 记忆 组 成 。 长 期 记忆 是 一 个 矩阵 ,和 矩阵 的 每 一 个 行 向 量 
是 一 个 句子 的 语义 表示 。 阅 读 时 ,记忆 网 络 可 以 把 给 定 的 句子 转换 成 内 部 表示 ,存储 到 长 
期 记忆 中 。 问 答 时 ,把 问 句 也 转换 成 内 部 表示 ,与 长 期 记忆 中 每 行 的 句子 语义 表示 进行 匹 
配 ,找到 答案 ,并 做 回答 。 

谷歌 DeepMind 的 Graves 等 发 明了 可 微分 神经 计算 机 (differentiable neural 
computer) 模 型 。 该 模型 由 神经 网 络 和 外 部 记忆 组 成 。 外 部 记忆 是 一 个 矩阵 ,可 以 表示 复 
杂 的 数据 结构 。 神 经 网 络 负责 对 外 部 记忆 进行 读 写 , 它 有 3 种 类 型 ,拥有 不 同 的 注意 力 机 
制 , 表 示 3 种 不 同 的 读 写 控制 ,对 应 哺乳 动物 中 海马 体 的 3 种 功能 。 神 经 网 络 在 数据 中 进 
行 端 到 端的 学 习 , 学 习 的 目标 函数 是 可 微分 的 函数 。 可 微分 神经 计算 机 模型 被 成 功 应 用 
到 包括 智能 问答 的 多 个 任务 中 。 

谷歌 的 Neelakantan 等 开发 了 神经 编程 器 (neural programmer) 模 型 ,可 以 从 关系 数 
据 库 中 寻找 答案 ,自动 回答 自然 语言 问题 。 模 型 整体 是 一 个 循环 神经 网 络 。 每 一 步 都 是 
基于 问 句 的 表示 (神经 表示 ) 以 及 前 一 步 的 状态 表示 (神经 表示 ), 还 包括 计算 操作 的 概率 
分 布 和 列 的 概率 分 布 , 以 及 选择 对 数据 库 表 的 一 个 列 执行 一 个 操作 (符号 表示 )。 顺 序 执 
行 这 些 操 作 , 并 找到 答案 。 操 作 表示 对 数据 库 列 的 逻辑 或 算数 计算 ,如 求 和 、 大 小 比较 。 
学 习 时 ,整体 目标 函数 是 可 微分 的 ,用 梯度 下 降 法 训练 循环 神经 网 络 的 参数 。 

谷歌 的 Liang 等 开发 了 神经 符号 机 (neural symbolic machines) 模 型 。 神 经 符号 机 可 
以 从 知识 图 谱 三 元 组 中 找到 答案 ,回答 像 “ 美 国 最 大 的 城市 是 哪个 ?” 这 样 的 问题 。 模 型 是 
序列 对 序列 (sequence-to-sequence) 模 型 ,将 问题 的 单词 序列 转换 成 命令 的 序列 。 命 令 的 
序列 是 LISP 语言 的 程序 ,执行 程序 就 可 以 找到 答案 。 神 经 符号 机 的 最 大 特点 是 序列 对 
序列 模型 表示 和 使 用 程序 执行 的 变量 ,用 附加 的 键 -变量 记忆 (key-variable memory) 记 录 
变量 的 值 , 其 中 键 是 神经 表示 ,变量 是 符号 表示 。 模 型 的 训练 是 基于 强化 学 习 ( 策 略 梯度 
法 ) 的 端 到 端的 学 习 。 

华为 公司 的 吕 正 东 等 开发 了 神经 查询 器 (neural enquirer) 符号 查询 器 (symbolic 
enquirer) 和 连接 查询 器 (coupled enquirer)3 个 模型 ,用 于 自然 语言 的 关系 数据 库 查 询 。 
例如 ,可 以 从 奥林匹克 运动 会 的 数据 库 中 寻找 答案 ,回答 “观众 人 数 最 多 的 奥运 会 的 举办 
城市 的 面积 有 多 大 ?” 这 样 的 问题 。 问 答 系统 包括 语言 处 理 模块 .短期 记忆 ,长 期 记忆 和 查 
询 器 ,语言 处 理 模块 又 包括 编码 器 和 解码 器 。 查 询 器 基于 短期 记忆 的 问题 表示 (神经 表 
示 ) 从 长 期 记忆 的 数据 库 中 (符号 表示 与 神经 表示 ) 寻 找 答 案 。 符 号 查询 器 是 一 个 循环 神 
经 网 络 ,将 问 句 的 表示 (神经 表示 ) 转 换 为 查询 操作 (符号 表示 ) 的 序列 ,执行 操作 序列 就 可 
以 找到 答案 。 利 用 强化 学 习 , 具 体 的 策略 梯度 法 ,可 以 端 到 端 地 学 习 此 循环 神经 网 络 。 神 
经 查询 器 是 一 组 深度 神经 网 络 , 将 问 句 的 表示 (神经 表示 ) 多 次 映射 到 数据 库 的 一 个 元 素 
(符号 表示 ) ,也 就 是 答案 ,其 中 一 个 神经 网 络 表示 一 次 映射 的 模式 。 利 用 深度 学 习 , 具 体 
的 梯度 下 降 法 ,可 以 端 到 端 地 学 习 这 些 深 度 神经 网 络 。 符 号 查询 器 执行 效率 高 ,学习 效 率 
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不 高 ;神经 查询 器 学 习 效率 高 ,执行 效率 不 高 。 连 接 查询 器 结合 了 两 者 的 优点 。 学 习 时 首 
先 训练 神经 查询 器 ,然后 以 其 结果 训练 符号 查询 器 ,问答 时 只 使 用 符号 查询 器 。 


8.11.3 聊天 机 器 人 研究 存在 的 挑战 


当前 ,聊天 机 器 人 的 研究 存在 的 挑战 包括 : 对 话 上 下 文理 解 和 知识 理解 \ 对 话 上 下 文 
建 模 、 对 话 过 程 中 的 知识 表示 、 对 话 策略 学 习 、 聊 天 机 器 人 智能 程度 的 评价 等 。 

(1) 对 话 上 下 文理 解 和 知识 理解 : 在 多 轮 对 话 时 ,机 器 人 往往 抓 不 住 上 下 文 的 要 点 ， 
经 常 给 出 一 些 与 上 下 文 无 关 或 者 是 前 后 矛盾 的 回复 。 因 此 ,聊天 机 器 人 首先 应 该 是 能 理 
解 。 这 种 理解 ,狭义 上 是 指 对 当前 对 话 的 理解 ,如 谁 说 了 什么 ,怎么 说 的 ,上 下 文 逻辑 是 什 
么 ,有 什么 意图 等 ;而 广义 上 则 是 对 整个 世界 的 理解 ,如 对 话 中 各 种 实体 的 理解 ,概念 的 内 
涵 、 外 延 的 理解 ,以 及 能 够 把 握 它们 之 间 的 联系 ,具有 和 一 般 人 相当 的 对 于 常识 的 认识 等 。 

(2) 对 话 上 下 文 建 模 : 聊天 是 一 个 有 特定 背景 的 连续 交互 过 程 ,在 这 一 过 程 中 经 常 
出 现 上 下 文 省 略 和 指 代 的 情况 。 一 句 话 的 意义 有 时 要 结合 对 话 上 下 文 或 者 相关 的 背景 才 
能 确定 ,而 现 有 的 自然 语言 理解 主要 基于 上 下 文 无 关 假 设 , 因 此 对 话 上 下 文 的 建 模 成 为 聊 
天 机 器 人 系统 的 主要 挑战 之 一 。 

(3) 对 话 过 程 中 的 知识 表示 : 知识 表示 一 直 就 是 人 工 智 能 领域 的 重要 课题 ,也 是 聊 
天 机 器 人 提供 信息 服务 的 基础 。 聊 天 机 器 人 相关 的 领域 任务 可 能 有 复杂 的 组 成 ,牵涉 很 
多 因素 ,只 有 了 解 这 些 因素 的 关系 和 相关 的 含义 ,才能 与 用 户 做 到 真正 意义 上 的 交流 。 

(4) 对 话 策略 学 习 : 对 话 策略 涉及 很 多 方面 ,其 中 最 主要 的 是 对 话 的 主导 方式 。 对 
话 主 导 方 式 可 以 分 为 用 户主 导 、 系 统 主导 和 混合 主导 3 种 方式 。 在 当前 的 对 话 管理 研究 
中 ,系统 应 答 的 目标 是 自然 ,友好 、 积 极 ,在 不 会 发 生 问题 的 情况 下 ,让 用 户 尽 可 能 自主 , 实 
现 对 话 的 混合 主导 。 

(5) 聊天 机 器 人 智能 程度 的 评价 : 目前 ,聊天 机 器 人 智能 程度 的 评价 也 是 一 项 挑战 。 
虽然 可 以 采用 一 些 通用 的 客观 评价 标准 ,如 回答 正确 率 \ 任 务 完成 率 、 对 话 回合 数 、 对 话 时 
间 、 系 统 平均 响应 时 间 、 错 误 信息 率 等 ,对 聊天 机 器 人 进行 评价 ,评价 的 基本 单元 是 单 轮 对 
话 。 但 是 ,由 于 人 机 对 话 过 程 是 一 个 连续 的 过 程 ,而 对 不 同 聊天 机 器 人 系统 的 连续 对 话 的 
评价 仅 能 保证 首 句 输入 的 一 致 性 , 当 对 话 展开 后 ,不 同系 统 的 回复 不 尽 相 同 , 因 此 不 能 简 
单 地 将 连续 对 话 切 分 成 单 轮 对 话 去 评价 。 于 是 ,设计 合理 的 人 工 主 观 评价 也 许 能 够 成 为 
客观 评价 标准 之 外 对 聊天 机 器 人 系统 智能 程度 评价 的 重要 指标 。 今 后 的 聊天 机 器 人 研究 
则 更 加 注重 “情商 ”, 即 注重 聊天 机 器 人 的 个 性 化 情感 抚慰 ,心理 朴 导 和 精神 陪护 等 能 力 。 


8.12 小 结 


自然 语言 理解 是 一 件 困难 的 工作 ,这 主要 是 由 于 不 同 的 应 用 对 于 理解 系统 提出 了 不 
同 的 要 求 , 因 此 导致 目标 表示 的 复杂 程度 有 很 大 差异 。 另 外 ,在 理解 过 程 中 ,将 源 句子 转 
换 为 目的 句子 的 时 候 存在 着 不 确定 性 ,它们 之 间 不 存在 简单 的 映射 关系 。 源 句子 中 各 成 
分 之 间 、 句 子 和 句子 之 间 在 语义 上 都 具有 相关 性 ,在 句子 中 处 于 同样 位 置 的 词组 会 因 语 义 
相关 性 导致 句法 结构 的 较 大 差异 。 
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刘 挺 在 文章 “语言 处 理 的 十 个 发 展 趋势 "中 指出 自然 语言 处 理 的 趋势 如 下 : @ 语 义 表 
示 : 从 符号 表示 到 分 布 表示 ; @ 学 习 模 式 : 从 浅 层 学 习 到 深度 学 习 ; @NLP 平台 化 : 从 
封闭 走向 开放 ; 图 语言 知识 : 从 人 工 构建 到 自动 构建 ; @ 对 话机 器 人 : 从 通用 到 场景 化 ; 
@ 文 本 理解 与 推理 : 从 浅 层 分 析 向 深度 理解 迈进 ; @ 文 本 情感 分 析 : 从 事实 性 文本 到 情 
感 文本 ; 图 社会 媒体 处 理 : 从 传统 媒体 到 社交 媒体 ; @ 文 本 生成 : 从 规范 文本 到 自由 文 
本 ; 四 NLP 十 行业 : 与 领域 深度 结合 ,为 行业 创造 价值 。 

本 章 从 语言 理解 的 层次 上 对 词法 分 析 、 句 法 分 析 、 语 义 分 析 、 大 规模 真实 文本 分 析 等 
进行 了 介绍 。 这 些 都 是 一 些 基本 的 技术 或 方法 ,要 真正 用 来 解决 实际 问题 ,达到 比较 好 的 
效果 ,如 对 句子 翻译 ,文本 翻译 以 及 语言 环境 的 处 理 , 还 有 很 多 问题 需要 突破 。 

长 远 来 看 ,自然 语言 理解 程序 会 成 为 大 多 数 软件 的 一 部 分 ,主要 的 功能 或 需求 是 作为 
前 端 和 用 户 进行 通信 的 工具 。 

自然 语言 处 理 (NLP) 主 要 技术 可 以 分 为 3 层 。 底 层 是 自然 语言 的 基本 技术 ,包括 词 
汇 级 \ 短 语 级 、 句 子 级 和 篇 章 级 的 表示 ,如 词 和 句子 的 多 维 向 量 表示 ,分词 .词性 标记 句法 
分 析 和 篇 章 分 析 。 中 间 层 是 自然 语言 的 核心 技术 ,包括 机 器 翻译 、 提 问 和 问答 、 信 息 检索 、 
信息 抽取 、 聊 天 和 对 话 、 知 识 工 程 、 自 然 语言 生成 和 推荐 系统 等 。 上 层 是 NLP 十 ,就 是 
NLP 的 应 用 ,如 搜索 引擎 .智能 客服 .商业 智能 .语音 助手 等 ;也 包括 在 很 多 垂直 领域 (如 
银行 金融、 交通 .教育 .医疗 .军事 领域 ) 的 应 用 。NLP 技术 及 其 应 用 是 在 相关 技术 或 者 
大 数据 支持 下 进行 的 。 用 户 画 像 、 大 数据 、 云 计算 平台 、 机 器 学 习 、 深 度 学 习 , 以 及 知识 图 
谱 等 构成 了 NLP 的 支撑 技术 和 平台 。 

谷歌 推出 了 基于 知识 图 谱 的 新 型 搜索 服务 。 与 传统 网 页 搜索 相 比 ,基于 知识 图 谱 的 
搜索 能 够 更 好 地 理解 用 户 的 搜索 意图 ,并 对 相关 内 容 和 主题 进行 总 结 。 未 来 的 搜索 是 知 
慧 搜 索 。 中 精准 搜索 意图 理解 ,体现 精准 分 类 语义 理解 .个 性 化 ; @@ 复 杂 多 元 对 象 搜索 ， 
如 表格 文本、 图 片 .视频 \ 文 案 , 素 材 、 代 码 ,专家 ; 加 多 粒度 搜索 ,体现 篇 章 级 .段落 级 、 语 
句 级 等 粒度 ; @ 跨 媒体 搜索 , 即 不 同 媒体 数据 联合 完成 搜索 任务 。 

自然 语言 的 发 展 从 基于 规则 方法 到 基于 统计 方法 ,再 到 基于 深度 学 习 的 方法 ,技术 越 
来 越 成 熟 了 ,而 且 很 多 领域 都 取得 了 巨大 的 进步 。 随 着 深度 神经 网 络 技术 ,大 数据 ` 云 计 
算 这 3 个 主要 因素 的 推动 ,自然 语言 处 理 越 来 越 实 用 。 第 一 ,手机 语音 翻译 实用 化 , 拿 起 
电话 说 话 , 从 中 文 翻译 成 英文 (或 日 文 .法 文 等 ) ,通常 情况 可 达 实用 。 第 二 ,自然 语言 的 会 
话 技 术 ( 包 括 聊 天 问答) 会 在 单 轮 精度 和 多 轮 建 模 上 进一步 突破 ,并 可 应 用 于 智能 家 居 和 
语音 助手 等 领域 。 第 三 ,智能 客服 系统 。 单 轮 可 以 解决 的 工作 ,以 及 可 明确 定义 对 话 状态 
的 多 轮 交 互 ,将 被 智能 客服 所 取代 。 智 能 客服 加 上 人 工 客服 完美 的 结合 ,将 使 客服 的 效率 
大 幅 提高 。 第 四 ,自然 语言 生成 的 各 项 任务 (如 写 诗 、 写 小 说 、 写 新 闻 稿 件 等 ) 在 未 来 5 一 
10 年 会 得 到 实际 应 用 。 最 后 ,自然 语言 技术 配合 其 他 AI 的 技术 (如 感知 智能 的 技术 ,在 
医疗 .军事 .教育 ,银行 法 律 \ 投 融资 `, 无 人 驾驶 等 垂直 领域 ) 会 起 到 实 实在 在 的 应 用 。 

在 语音 识别 方面 ,基于 深度 学 习 的 语音 识别 系统 目前 已 经 在 识别 准确 率 方面 有 了 显 
著 提 升 ,未 来 深度 学 习 将 继续 在 海量 语音 数据 的 精细 学 习 、 持 续 提升 识别 系统 的 口音 覆盖 
和 噪声 场景 鲁 棒 性 等 方面 发 挥 重要 作用 ;在 语音 合成 和 声音 转换 方面 ,建立 考虑 语音 时 序 
特性 的 深层 产生 模型 以 及 使 用 深层 模型 实现 对 基 频 等 前 律 特征 的 预测 与 转换 将 是 今后 的 
研究 重点 ;在 语音 增强 和 分 离 方面 ,未 来 的 研究 重点 之 一 是 通过 海量 语音 和 噪声 数据 的 覆 
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盖 以 及 设计 合理 的 后 处 理 算法 ,提高 DNN 模型 在 实际 噪声 场景 下 的 推广 性 和 通用 性 。 
计算 机 还 不 能 自动 地 对 数据 进行 第 选 和 提炼 ,抽取 信息 和 知识 ,并 把 它们 关联 起 来 ， 
存储 在 长 期 记忆 里 ,为 人 类 服务 。 未 来 会 有 这 样 的 智能 信息 和 知识 管理 系统 出 现 , 它 能 够 
自动 获取 信息 和 知识 ,如 对 之 进行 有 效 的 管理 ,能 准确 地 回答 各 种 问题 ,成 为 每 一 个 人 的 
智能 助手 。 


习题 





1 什么 是 自然 语言 理解 ? 自然 语言 理解 过 程 有 哪些 层次 ? 各 层次 的 功能 如 何 ? 

2 为 什么 说 计算 机 理解 自然 语言 是 一 件 困难 的 任务 ? 原因 是 什么 ? 

3 在 理解 语言 上 ,人 脑 和 电脑 (机 器 ) 之 间 有 没有 不 可 逾越 的 鸿沟 ? 

4 ”阐述 短语 文法 结构 和 Chomsky 的 语言 体系 ,说 明 各 种 语言 对 文法 规则 表示 形式 的 
限制 。 

8.5 给 出 下 列 句子 的 句法 分 析 树 。 


(1) The boy smoked a cigarette. 


各 名 名 


(2) The cat ran after a rat. 
(3) She used a fountain pen to write her biography. 

8.6 转移 网 络 和 ATN 的 工作 原理 是 什么 ?为 什么 说 ATN 使 句法 分 析 器 具有 分 析 上 下 
文 有 关 语 言 的 能 力 ? 

8.7 用 转移 网 络 分 析 The man reacted sharply。 

8.8 什么 是 语义 文法 ? 什么 是 格 文法 ? 它们 各 有 什么 特点 ? 

8.9 用 格 结构 表示 下 面 的 句子 。 

(1) The plane flew above the clouds. 
(2) John flew to New York. 

10 ” 简 述 搜索 引擎 的 工作 原理 。 

11 智能 搜索 引擎 分 哪 几 类 ? 

机 器 翻译 系统 可 以 分 成 哪 几 种 类 型 ? 

13 简 述 语音 识别 过 程 。 

14 (思考 题 ) 建 立 一 个 包含 10 个 查询 的 测试 集 ,把 它们 提交 给 3 个 主要 的 万 维 网 搜索 

引擎 。 评 估 每 个 搜索 引擎 分 别 在 返回 1,3,10 篇 文档 时 的 准确 率 。 你 能 解释 它们 
之 间 的 区 别 吗 ? 

8.15 (思考 题 ) 编 写 一 个 正则 表达 式 或 者 一 个 简短 的 程序 用 来 抽取 公司 名 称 。 请 在 商业 
新 闻 语 料 库 上 对 其 进行 测试 。 报 告 你 的 准确 率 和 召回 率 。 

8.16 (思考 题 ) 知识 图 谱 。 谷 歌 推 出 的 知识 图 谱 智 能 化 搜索 功能 ,其 目标 就 是 对 搜索 结 
果 进 行 系统 的 知识 整理 ,使 每 个 用 户 查 询 的 关键 词 都 能 映射 到 知识 库 的 概念 上 。 
阅读 相关 文献 , 曾 述 主要 技术 及 应 用 。 

8.17 (思考 题 ) 多 媒体 信息 检索 。 伴 随 着 便携 式 数码 设备 的 流行 以 及 媒体 压缩 、 存 储 和 
通信 技术 的 进步 ,多 媒体 数据 呈现 爆炸 式 增长 并 全 方位 渗透 到 人 们 的 生活 中 。 如 
何 有 效 地 对 多 媒体 信息 进行 检索 ,一 直 是 多 媒体 以 及 信息 检索 研究 领域 的 热点 问 
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8.19 


8. 21 


8.22 


题 。 阅 读 相 关 文献 , 阑 述 主要 技术 及 应 用 。 
(思考 题 ) 语义 万 维 网 搜索 。 语 义 万 维 网 将 统一 资源 标识 符 (Uniform Resource 
Identifier, URD 标 识 的 范围 从 网 页 等 信息 资源 拓展 到 所 有 事物 ,特别 是 真实 世界 
中 的 实体 (如 一 本 书 ) 以 及 人 们 在 社会 实践 中 形成 的 概念 (如 书 、 作 者 等 ), 并 采用 基 
于 图 的 资源 描述 框架 (Resource Description Framework,RDF) 作 为 统一 的 数据 模 
型 描述 事物 与 事物 之 间 的 关联 ;而 且 ,不同 的 万 维 网 应 用 在 描述 事物 时 共享 由 一 组 
相关 概念 描述 形成 的 万 维 网 本 体 (Web Ontology, 简 称 本 体 ), 从 而 使 万 维 网 上 的 
数据 交换 从 语法 级 别提 升 到 语义 级 别 。 面 对 海量 的 基于 本 体 的 资源 描述 框架 数 
据 , 万 维 网 搜索 面临 一 系列 新 挑战 ,也 相继 产生 了 许多 建立 在 新 的 搜索 模型 和 方法 
上 的 搜索 引擎 。 这 一 新 兴 领 域 统称 为 语义 万 维 网 搜索 。 阅 读 相 关 文献 ,阐述 主要 
技术 及 应 用 。 
(思考 题 ) 交 互 式 搜索 意图 理解 。 现 代 搜索 引擎 在 协助 用 户 完成 复杂 查询 任务 方面 
的 能 力 仍 极为 有 限 , 用 户 需要 将 大 量 认 知 精力 耗费 在 寻找 导航 提示 上 ,这 使 得 阅读 
和 选择 所 需 信息 的 过 程 不 可 避免 地 受到 影响 。 交 互 式 搜索 意图 理解 通过 计算 建 模 
和 可 视 化 交互 的 方式 协助 用 户 进 行 信息 探索 ,通过 有 效 的 交互 界面 使 得 用 户 获取 
信息 。 在 进行 任务 级 别 的 信息 查找 时 ,交互 式 搜索 意图 理解 能 够 极 大 地 提高 用 户 
的 信息 获取 效率 。 阅 读 相 关 文 献 , 阐 述 主要 技术 。 
(思考 题 ) 考 虑 这 样 一 个 问题 : 评估 返回 答案 排名 列表 (如 同 大 部 分 万 维 网 搜索 引 
擎 ) 的 IR( 信 息 检 索 ) 系 统 质量 的 问题 。 合 适 的 质量 评估 方法 依赖 于 搜索 用 户 的 意 
图 模型 及 其 采取 的 策略 。 针 对 不 同 需 求 , 提 出 相应 的 定量 评测 方法 。 
(思考 题 ) 机 器 翻译 模型 假设 ,在 短语 翻译 模型 中 挑选 出 短语 .扭曲 模型 改变 顺序 之 
后 ,语言 模型 可 以 整理 所 有 的 组 合 。 本 题 研究 这 个 假设 是 否 明 智 。 试 着 将 下 列 语 
句 按 正确 的 词语 顺序 排列 。 
(1) have, programming, a, seen, never, I, language, better 
(2) loves,john, mary 
(3) is the, communication, exchange of, intentional, information brought, by, 
about, the production, perception of, and signs, from, drawn, a, of, 
system, signs, conventional, shared 
(4) created, that, we hold these, to be, all men, truths, are, equal, self-evident 
你 能 完成 哪些 语句 的 正确 排列 ? 你 需要 利用 哪些 知识 ?在 训练 语料库 上 训练 一 个 
二 元 模型 ,用 该 模型 从 测试 语 料 中 找到 某 些 句子 的 概率 最 高 的 组 合 。 报 告 该 模型 
的 准确 率 。 
(思考 题 ) 美 国 地 理 。 应 用 Prolog 推理 机 制 或 其 他 语言 开发 美国 地 理 数据 库 , 并 设 
计 自 然 语言 交互 界面 。 用 英语 自然 语言 方式 查询 美国 的 州 名 、 州 府 、 面 积 、 人 口 \ 城 
市 河流 ,湖泊 、 山 脉 、 公 路 、 邻 州 、 州 内 制高点 、 制 低 点 等 地 理 情况 。 例 如 : 


States? 








Give me the cities in California. 
一 一 What is the biggest city in Texas? 
一 一 What is the longest river in the USA? 
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一 一 Which river are more than 1 thousand miles long? 

一 一 What is the name of the state with the lowest point? 

一 一 Which states border Alabama? 

一 一 Which rivers do not run through Texas? 

一 一 Which rivers run through states that border the state whose capital is 


Austin? 


第 章 
智能 规划 


智能 规划 (automated planning/AI planning) 是 一 种 问题 求解 技术 , 它 以 
某 个 特定 的 问题 状态 开始 ,寻找 能 实现 目标 的 一 系列 动作 。 这 一 系列 动作 称 
为 规划 解 ,简称 为 规划 (plan) 。 一 个 总 规划 可 以 含有 若干 个 子规 划 。 本 章 首 
先 对 规划 问题 进行 描述 ,然后 介绍 一 种 表达 能 力 丰 富 且 设计 精巧 的 用 于 表示 
规划 问题 (包括 操作 和 状态 ) 的 问题 建 模 语言 ,并 进一步 说 明 搜索 过 程 也 是 一 
种 规划 过 程 ,介绍 前 向 后 向 搜索 算法 和 根据 规划 问题 的 表示 结构 设计 启发 
式 函 数 的 技术 ,进而 利用 规划 问题 的 表示 ,探讨 不 同 于 状态 空间 搜索 的 规划 
算法 ,如 偏 序 规划 、 命 题 逻辑 规划 、 分 层 网 络 规划 、 非 确定 性 规划 条件 规划、 
持续 规划 、 多 Agent 规划 等 。 


9.1 规划 问题 


使 用 标准 搜索 算法 (如 深度 优先 、.A* 等 ) 求 解 问题 时 ,如 果 遇 到 现实 世界 
的 大 规模 问题 ,就 会 产生 许多 困难 。 

最 明显 的 困难 在 于 问题 求解 过 程 可 能 济 没 在 不 相关 的 动作 中 。 如 从 一 
个 联机 书 商 购买 一 本 (人 工 智能 》 的 任务 ,包含 了 许多 不 相关 的 动作 。 假 设 对 
于 每 一 个 十 位 数 的 ISBN 码 , 都 可 以 发 生 一 个 购买 动作 , 则 总 共有 100 亿 个 
动作 。 搜 索 算 法 必须 检查 全 部 100 亿 个 动作 的 后 续 状 态 找 出 满足 目标 的 一 
个 动作 ,从 而 实现 拥有 一 册 ISBN 号 为 0137903952 的 书 。 另 外 ,一 个 明智 的 
规划 系统 应 能 根据 先前 明确 的 目标 描述 ,例如 ,Have(ISBN0137903952) 来 工 
作 , 并 直接 产生 Buy(ISBN0137903952) 的 动作 。 为 了 实现 这 种 计算 ,只 需要 
Buy(x) 的 通用 知识 ,已 知 这 个 知识 和 目标 ,规划 能 够 通过 一 个 简单 的 合 一 步 
又 判断 Buy(ISBN0137903952) 是 正确 的 动作 。 

接 下 来 的 困难 是 寻找 一 个 好 的 启发 函数 。 假 设 Agent 的 目的 是 在 线 购 
买 4 本 不 同 的 书 , 有 待考 查 的 含 4 个 动作 的 规划 会 有 10” 个 ,所 以 没有 准确 
启发 式 的 搜索 是 不 可 能 的 。 很 显然 ,对 人 来 说 ,未 买 到 的 书 的 数目 ?是 对 状 
态 的 目标 距离 的 一 个 较 好 的 启发 式 估计 ;但 是 ,问题 求解 系统 不 能 显而易见 
地 拥有 这 种 分 析 能 力 。 因 为 在 它 看 来 ,测试 一 个 状态 是 否 满足 目标 条 件 的 过 
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程 只 是 一 个 返回 逻辑 真 、 假 值 的 黑 盒 子 , 它 不 会 计算 有 多 少 个 目标 条 件 仍 未 满足 。 
此 ,问题 求解 Agent 缺乏 自主 性 ; 它 需 要 人 对 每 个 新 问题 提供 一 个 启发 函数 。 另 外 ,如 
果 一 个 规划 系统 能 够 明确 地 将 目标 表示 成 为 目标 条 件 的 合 取 式 ,那么 它 就 可 以 使 用 一 
个 不 依赖 于 具体 领域 问题 特性 的 启发 式 函数 : 未 满足 的 合 取 式 的 数目 。 例 如 ,对 于 买 
书 问 题 ,目标 条 件 是 Have(A) A Have(B) 人 Have(C) 人 Have(CD) ,满足 了 Have(B) 的 
状态 的 目标 距离 是 3。 这 样 ,Agent 就 能 为 这 个 问题 以 及 其 他 很 多 问题 自动 获得 合适 的 
启发 式 函 数 。 

最 后 ,问题 求解 系统 可 能 是 低 效 的。 因为 它 不 能 将 问题 进行 分 解 。 考 虑 这 样 一 个 问 
题 ,要 将 一 组 需要 隔夜 交付 的 包 里 递送 到 它们 各 自 的 目的 地 ,而 这 些 目的 地 散布 于 整个 国 
家 或 地 区 。 为 每 个 目的 地 找到 最 近 的 机 场 并 且 将 整个 问题 分 解 成 每 个 机 场 的 子 问 题 是 一 
种 有 效 的 问题 求解 方式 。 在 途经 指定 机 场 的 一 组 包 庄 中 ,可 以 根据 目标 城市 进行 进一步 
的 分 解 。 我 们 前 面 讨论 过 进行 这 种 分 解 的 能 力 归功 于 约束 满足 问题 求解 系统 的 有 效 性 。 
对 于 规划 ,这 同样 成 立 : 在 最 坏 情况 下 , 它 将 要 花费 OCzl) 的 时 间 以 找到 递送 冯 件 包 庄 的 
最 佳 规划 ,但 是 如 果 能 够 把 问题 分 解 成 上 个 规模 相当 的 子 问题 ,那么 只 需要 O(CCza/A)! Xx 
k) 的 时 间 。 

实际 上 ,规划 问题 仅 在 少数 的 理想 情况 下 才能 完全 可 分 解 。 许 多 规划 系统 的 设计 ( 特 
别 是 后 面谈 到 的 偏 序 规划 器 ) 基 于 如 下 假设 : 现实 世界 的 大 多 数 问题 是 近似 可 分 解 的 。 
也 就 是 说 ,规划 器 能 够 独立 地 在 子 目 标 上 工作 ,随后 执行 一 些 额 外 的 工作 将 各 个 子规 划 解 
合并 起 来 形成 最 终 的 总 规划 解 。 在 某 些 问题 上 ,由 于 一 个 子 目 标的 实现 过 程 可 能 撤销 或 
阻碍 另 一 个 子 目 标的 实现 ,这 种 子 目标 之 间 的 相互 作用 使 得 规划 问题 无 法 分 解 ( 如 九宫 图 
游戏 ) ,从 而 导致 规划 问题 的 求解 异常 困难 。 

规划 问题 可 以 通过 状态 .动作 和 目标 表示 ,这 种 表示 的 好 处 是 使 规划 算法 能 利用 问题 
的 多 辑 结构 进 行 信息 处 理 。 因 此 ,规划 求解 的 一 个 关键 是 找到 一 种 有 足够 表达 能 力 能 够 
描述 较 多 类 规划 问题 但 又 语法 简约 的 语言 ,以 使 规划 算法 能 够 较 高 效 地 解析 。 为 使 读者 
理解 规划 问题 的 表示 语言 ,本 节 首 先 介绍 主流 的 经 典 规划 问题 表示 语言 一 -STRIPS 
(Stanford Research Institute of Problem Solver) 语 言 。 

下 面 从 状态 、 目 标 和 动作 的 表示 方面 简要 介绍 STRIPS 语言 。 

1. 状态 表示 

规划 器 将 世界 分 解 成 逻辑 条 件 , 并 且 把 一 个 状态 表示 为 正文 字 的 合 取 。 我 们 将 考虑 
命题 文字 ,例如 ,Poor 人 Unknown 可 能 表示 了 一 个 贫困 而 无 名 的 不 幸 状 态 。 也 可 以 使 用 
一 阶 文字 ,例如 ,Ai(CPLanei ,Melbourne) 人 At(Plane, ,Sydney) 可 表示 包 庄 递送 问题 中 的 
一 个 状态 ,一 阶 状态 描述 中 的 文字 必须 是 基 项 (ground, 即 无 变量 的 项 ) 并 且 是 无 函数 
(functiorfree) 的 ,而 形 如 Art(z,y) 或 A1(Father(Fred),Sydney) 的 文字 是 不 允许 的 。 
需要 注意 的 是 ,在 一 个 状态 中 未 提 及 的 条 件 被 假定 为 假 。 

2. 目标 表示 

目标 是 用 正 的 基文 字 的 合 取 式 表示 的 不 完全 指定 状态 ,如 Rich A Famous 或 At(P,， 
Tahiti) 。 假 如 一 个 命题 状态 * 包含 目标 g 的 所 有 原子 (可 能 还 有 其 他 原子 ) ,那么 * 满足 
g。 例 如 ,状态 Rich 人 Famous 作 Miserable 满足 目标 Rich Famous。 
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3. 动作 表示 
一 个 动作 是 根据 前 提 和 效果 指定 的 ,前 提 (PRECOND) 在 该 动作 执行 前 必须 成 立 , 效 
果 (EFFECT) 则 在 其 执行 后 发 生 。 例 如 ,一 个 表示 飞机 从 一 个 地 方 到 另 一 个 地 方 的 动作 : 
Action(Fly(p, from,to)). 
PRECOND: Ai(p,from) MPlane(p) MAirport(from) MAirport(to), 
EFFECT: Ap,from)MNAr(p, 10)) 
更 确切 地 称 为 动作 模式 ,意思 是 它 表 示 了 许多 不 同 动作 ,这 些 动作 能 够 通过 把 变量 p， 
Jfrom 和 to 初始 化 为 不 同 常量 得 到 。 通 常 , 一 个 动作 模式 由 3 部 分 组 成 。 
(1) 动作 名 和 参数 表 , 例 如 ,Fly(p ,from,to) 用 来 标识 动作 。 
(2) 前 提 是 无 函数 正文 字 的 合 取 式 ,规定 在 动作 能 够 被 执行 前 ,一 个 状态 中 的 哪些 文 
字 必 须 为 真 。 前 提 中 的 任何 变量 也 必须 出 现在 动作 参数 表 中 。 
(3) 效果 是 无 函数 文字 的 合 取 式 ,描述 了 当 动作 执行 时 状态 是 如 何 变化 的 。 效 果 中 
的 正文 字 己 在 由 动作 产生 的 状态 中 被 断言 为 真 ,而 否定 文字 ( 负 文字 ) -=P 则 被 断言 为 
假 。 效 果 中 的 变量 也 必须 出 现在 动作 参数 表 中 。 
为 了 提高 易 读 性 ,一 些 规划 系统 将 效果 划分 为 正文 字 的 增加 表 和 负 文 字 的 删除 表 。 
在 定义 了 规划 问题 的 表示 语法 之 后 ,下 面 定义 语义 。 最 直接 的 方法 就 是 描述 动作 是 
如 何 影响 状态 的 。 首 先 , 我 们 称 一 个 动作 在 任何 满足 前 提 的 状态 下 都 是 可 用 的 ;否则 , 动 
作 没 有 结果 。 对 于 一 阶 的 动作 模式 ,建立 可 用 性 将 包括 一 个 对 前 提 中 变量 的 置换 0。 例 
如 ,假设 当前 状态 描述 为 
Ai(P1,JFK)AAi(P;,,SFO)A Plane(P1) AMPlane(P,) 
MAirport(JFK) A Airport(SFO) 
这 个 状态 满足 前 提 
Ai(p, from) MNPlane(p) MAirport(from) MAirport(to) 
用 (p/Pi,from/JFK ,to/SFO) 进 行 置换 。 这 样 ,具体 动作 Fliy(p，JFK，SFO) 是 可 
用 的 。 
从 状态 > 出 发 ,执行 一 个 可 用 动作 a 的 结果 是 状态 ,除了 把 a 的 效果 中 任何 正文 字 
PP 添加 到 ”中 ,把 任何 负 文字 了 P 从 s' 中 去 除 以 外 ,s 与 是 一 样 的 。 这 样 ,在 Fly(p， 
JFK,，SFO) 之 后 ,当前 状态 变 为 
Ai(P1,SFO) AMAi(P;,SFO)A Plane(P1) AM Plane(P;) 
NAirport(JFK) A Airport(SFO) 
注意 ,如 果 一 个 正 效果 已 经 在 ; 中 , 它 不 会 被 再 次 添加 ;如 果 一 个 负 效 果 不 在 * 中 ,这 部 分 
效果 将 被 忽略 。 这 个 定义 体现 了 STRIPS 的 “封闭 世界 假设 ”, 在 结果 中 没 提 及 的 每 个 文 
字 保 持 不 变 。 
最 后 ,我 们 可 以 定义 规划 问题 的 解 。 它 的 最 简单 形式 就 是 一 个 动作 序列 , 当 在 初始 状 
态 中 执行 时 ,导致 满足 目标 的 状态 。 
以 上 介绍 的 STRIPS 语言 ,其 中 各 种 强加 的 变量 限制 是 希望 规划 算法 更 加 简单 有 效 ， 
而 又 不 会 太 难 而 无 法 描述 现实 问题 。 一 个 最 重要 的 限制 是 文字 是 无 函数 的 。 根 据 这 个 限 
制 , 我 们 能 够 确信 对 于 一 个 给 定 问 题 的 任何 动作 模式 ,都 可 以 命题 化 一 一 也 就 是 说 ,转变 
成 一 个 没有 变量 的 纯 命题 动作 表示 的 有 限 集合 。 例 如 ,在 一 个 10 架 飞 机 和 5 个 机 场 的 问 
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题 的 航空 货物 域 中 ,可 以 把 Fliy(p,from,to) 模 式 转变 成 10X5X5 一 250 个 纯 命题 动作 。 
如 果 允 许 函 数 符号 ,那么 将 能 构建 出 无 限 多 的 状态 和 动作 。 
近年 来 的 研究 已 经 逐渐 表明 ,STRIPS 对 于 某 些 现实 领域 表达 能 力 不 足 。 结 果 是 , 开 
发 了 许多 语言 变种 。 表 9-1 简要 描述 了 一 种 重要 的 语言 , 即 动作 描述 语言 (Action 
Description Language,ADL) ,同时 与 基础 的 STRIPS 语言 进行 了 比较 。 在 ADL 中 ,Fly 
动作 可 以 被 写 为 
Action(Fly (p: Plane, from: Airport, to: Airport); 
PRECOND: At(p, from) MN (from A 10), 
EFFECT: Ai(p, from) MN Ar(p,to)) 
参数 表 中 的 符号 p: plane 是 前 提 中 plane(p) 的 一 个 缩写 ,这 虽然 没有 增加 表达 能 力 ， 
但 可 以 更 易 读 ,同时 也 缩减 了 能 够 构建 的 可 能 命题 动作 的 数目 。 前 提 (from 关 1o) 表 达 
了 飞机 航班 不 能 从 一 个 机 场 飞 到 同一 个 机 场 的 事实 。 这 在 STRIPS 语言 中 无 法 简洁 地 
表达 。 
表 9-1 STRIPS 语言 和 ADL 的 对 比 


























STRIPS 语言 ADL 
在 状态 中 只 有 正文 字 : 在 状态 中 , 正 、 负 文字 都 有 
Poor N Unknown 2 Rich \ - Famous 
封闭 世界 假设 : 开放 世界 假设 : 
未 被 提 及 的 文字 为 假 未 被 提 及 的 文字 是 未 知 的 
效果 PA "Q 意 味 着 增加 尸 ,删除 Q 效果 PA ~Q 意 味 着 增加 已 和 ”~Q 及 删除 "PP 和 Q 
目标 中 只 有 基文 字 : 目标 中 有 量化 变量 
Rich \ Famous 3zArPl, x) 
目标 是 合 取 式 : 目标 允许 合 取 式 和 析 取 式 : 
Rich 人 Famous - Poor N\ (FamousV Smart) 
允许 条 件 效果 : 
合 
SR When P; EE 表示 只 有 当 PP 被 满足 时 ,已 才 是 一 个 效果 
不 支持 等 式 内 建 了 等 式 谓 词 (z 一 y) 
不 支持 类 型 变量 可 以 拥有 类 型 ,如 (p: Plane) 








规划 域 定义 语言 (Planning Domain Definition Language, PDDL) 提 供 了 一 种 系统 化 、 
形式 化 的 建 模 方法 。 这 种 语言 允许 研究 者 交换 性 能 测试 问题 和 比较 结果 。PDDL 包括 针 
对 STRIPS、ADL 以 及 后 面谈 到 的 分 层 任务 网 络 规划 的 子 语言 。 

STRIPS 和 ADL 符号 表示 对 于 许多 现实 领域 是 足够 的 。 然 而 ,仍然 存在 一 些 重要 


的 限制 ,最 明显 的 是 它们 不 能 自然 地 表示 动作 的 分 支 (ramification) 。 例 如 ,如 果 飞 机 上 
有 人 、 包 里 或 灰尘 ,那么 当 飞 机 飞行 时 ,它们 的 位 置 也 在 变化 。 我 们 将 在 命题 逻辑 规划 
中 看 到 更 多 这 种 状态 约 东 的 例子 。 经典 规划 系统 甚至 没有 尝试 去 解决 限制 问题 
(qualification problem) ,未 表示 的 界限 可 能 引起 动作 失败 的 问题 ,这 些 将 在 9. 6 节 条 件 
规划 中 讨论 。 
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9.2 状态 空间 搜索 规划 


使 用 状态 空间 搜索 方法 完成 规划 问题 求解 的 技术 称 为 状态 空间 搜索 规划 。 因 为 规划 
问题 中 的 动作 描述 同时 说 明了 前 提 和 效果 ,所 以 有 可 能 在 两 个 方向 进行 搜索 : 从 初始 状 
态 向 前 搜索 或 从 目标 状态 向 后 搜索 。 我 们 也 能 使 用 明确 的 动作 和 目标 表示 自动 得 到 有 效 
的 启发 式 。 

1. 前 向 状态 空间 搜索 

前 向 状态 空间 搜索 规划 与 第 3 章 中 的 问题 求解 方法 相似 ,有 时 也 被 称 为 前 进 
(progression) 规 划 , 因 为 它 沿 向 前 的 方向 移动 。 我 们 从 问题 的 初始 状态 出 发 ,考虑 动作 序 
列 , 直 到 找到 一 个 得 到 的 目标 状态 的 序列 。 

现在 的 问题 是 如 何 把 规划 问题 形式 化 为 状态 空间 搜索 问题 。 

(1) 搜索 的 初始 状态 来 自 规划 问题 的 初始 状态 。 通 常 , 每 个 状态 会 有 一 个 正 的 基文 
字 的 集合 ,没有 出 现 的 文字 为 假 。 

(2) 可 用 于 一 个 状态 的 动作 是 那些 前 提 都 得 到 满足 的 。 动 作 产生 的 后 继 状态 通过 增 
加 正 效果 文字 和 删除 负 效 果 文字 生成 (在 一 阶 情况 下 ,必须 应 用 从 前 提 到 效果 文字 的 合 
一 )。 注 意 , 一 个 单一 的 后 继 函 数 对 所 有 规划 问题 都 可 行 ,并 且 使 用 明确 的 动作 表示 的 
结果 。 

(3) 检验 状态 是 否 满足 规划 问题 的 目标 。 

(4) 单 步 耗 散 通 常 是 1。 虽然 允许 不 同 的 动作 具有 不 同 的 耗 散 是 很 容易 的 ,但 是 
STRIPS 很 少 使 用 。 

回顾 一 下 ,在 不 出 现 函 数 符号 的 情况 下 ,规划 问题 的 状态 空间 是 有 限 的 。 因 此 ,任何 
完备 的 搜索 算法 (如 A* ) 都 将 是 一 个 完备 的 规划 算法 。 

从 规划 搜索 的 初期 直到 最 近 , 人 们 首先 认为 前 向 状态 空间 搜索 太 低 效 而 不 能 实际 应 
用 ,这 也 不 难 找到 原因 。 前 向 搜索 不 能 解决 无 关 动作 问题 , 即 所 有 可 用 动作 都 是 从 各 个 状 
态 出 发 考虑 的 ;其 次 ,如 果 没 有 一 个 好 的 启发 式 , 该 方法 就 会 迅速 陷 人 困境 。 考 虑 一 个 有 
10 个 机 场 ,每 个 机 场 有 5 架 飞 机 和 20 件 货 件 的 航空 货物 问题 ,目标 是 将 所 有 的 货物 从 机 
场 A 运送 到 机 场 B, 这 个 问题 有 一 个 简单 的 解 : 将 20 件 货物 装载 到 机 场 A 的 一 架 飞机 
上 ,飞机 到 机 场 B, 务 载 所 有 货物 ,但 是 找到 解 可 能 是 困难 的 。 因 为 平均 分 支 因子 是 巨大 
的 : 5 架 飞 机 中 的 任何 一 架 可 以 飞 到 9 个 其 他 的 机 场 ,200 件 包 庄 中 的 每 一 件 也 能 一 样 被 
外 载 (如 果 已 经 装载 了 ) 或 者 装载 到 机 场 的 任何 一 架 飞 机 上 (如 果 没 有 装载 ) 。 平 均 而 言 ， 
我 们 说 存在 大 约 1000 个 可 能 的 动作 ,所 以 达到 明显 解 的 深度 的 搜索 树 大约 有 10002 个 结 
点 。 显 然 ,需要 一 个 非常 精确 的 启发 式 ,才能 使 这 类 搜索 变 得 更 有 效率 ,在 考察 后 向 搜索 
之 后 ,我 们 将 讨论 一 些 可 能 的 启发 式 。 

2. 后 向 状态 空间 搜索 

后 向 状态 空间 搜索 在 第 3 章 中 进行 过 说 明 。 我 们 注意 到 当 目 标 状态 用 一 个 约束 集 描 
述 而 不 是 明确 地 列 出 时 ,后 向 搜索 难以 实现 。 特 别 地 ,如 何 生成 目标 状态 集 的 可 能 前 辈 的 
描述 并 不 总 是 显而易见 的 。STRIPS 表示 使 这 个 问题 变 得 相当 容易 ,因为 状态 集 能 够 被 
在 这 些 状 态 中 一 定 为 真 的 文字 所 描述 。 
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后 向 搜索 的 主要 优点 是 允许 只 考虑 相关 的 动作 。 如 果 一 个 动作 获得 目标 的 合 取 子 句 
中 的 一 个 ,我 们 就 说 这 个 动作 同 目标 合 取 式 是 相关 的 。 例 如 ,在 我 们 的 10 机 场 航空 货物 
问题 中 的 目标 是 B 机 场 拥有 20 件 货物 ,或 者 用 公式 表示 为 

Ar(Ci, B) A Ar(C,, B) A… A Ar(C», B) 

现在 考虑 合 取 子 句 Ar(C，B)。 使 用 后 向 搜索 ,寻找 以 此 合 取 子 句 为 效果 的 动作 。 
只 有 一 个 这 样 的 动作 : Upload (C1,p，B), 这 里 飞机 p 并 没有 被 指定 。 

注意 ,有 许多 不 相关 的 动作 也 能 够 导向 目标 状态 。 例 如 ,我 们 可 以 让 一 架空 飞机 从 
JFK 飞 到 SFO; 这 个 动作 从 “飞机 在 JFK 并 且 目 标的 所 有 合 取 子 句 都 得 到 满足 ”的 前 辈 
状态 达到 一 个 目标 状态 。 一 个 允许 不 相关 动作 的 后 向 搜索 仍然 是 完备 的 ,但 是 它 会 十 分 
低 效 。 假 如 解 存在 , 它 就 能 够 被 只 允许 相关 动作 的 后 向 搜索 找到 。 相 关 动 作 的 限制 意味 
着 后 向 搜索 比 前 向 搜索 的 分 支 因子 少 得 多 。 例 如 ,我 们 的 航空 货物 问题 有 约 1000 个 从 初 
始 状态 出 发 的 前 向 动作 ,但 是 从 目标 出 发 的 后 向 动作 只 有 20 个 可 行 。 

后 向 搜索 有 时 也 称 为 回归 规划 。 回 归 规 划 中 的 原则 问题 是 这 样 的 : 对 哪些 状态 应 用 
动作 会 到 达 目 标 ? 计算 这 些 状态 的 描述 称 为 经 过 动作 的 目标 回归 。 考 虑 航空 货物 例子 ， 
有 目标 





AL(Ci, B) A Ai(C:, B) A… AAA(Co,，B) 
和 获得 第 一 个 合 取 子 句 的 相关 动作 Upload (C1 ,pp，B), 仅 当 其 前 提 得 到 满足 时 ,动作 才 
会 起 作用 。 因 此 ,任何 前 辈 状 态 都 必须 包含 这 些 前 提 : In(Ci,p)A 人 Ai(p,B)。 而且, 子 
目标 AxCC:，B) 在 前 辈 状 态 中 应 该 不 为 真 。 因 此 ,前辈 的 描述 是 
In(Ci,p) A Ai(p, B) A Ai(C,, B) 人 … A At(C», B) 

除了 要 使 动作 达到 某 个 期 望 的 文字 外 ,还 必须 使 动作 不 撤销 任何 期 望 的 文字 。 一 个 
满足 这 种 约束 的 动作 被 称 为 一 致 的 。 例 如 ,动作 Load(C;，p) 与 当前 的 目标 不 是 一 致 的 ， 
因为 它 会 否定 文字 Ax(Cs ，B) 。 

在 给 定 相关 性 和 一 致 性 的 定义 之 后 ,我 们 能 够 描述 后 向 搜索 中 构造 前 辈 的 一 般 过 程 。 
已 知 一 个 目标 描述 G,A 是 一 个 相关 而 且 一 致 的 动作 。 对 应 的 前 辈 要 满足 : 

(1) 删除 G 中 出 现 的 A 的 任何 正 效 果 。 

(2) 添加 A 的 每 一 个 前 提 文字 ,除非 它 已 经 出 现 了 。 

任何 标准 的 搜索 算法 都 能 被 用 来 执行 这 个 搜索 。 当 生成 的 前 辈 描述 被 规划 问题 的 初 
始 状态 所 满足 时 ,生成 终止 。 在 一 阶 情况 下 ,满足 性 可 能 需要 前 辈 描 述 中 的 变量 置换 。 例 
如 ,前 一 段落 中 的 前 辈 描 述 , 通 过 置换 { Pi,/p} 被 初始 状态 

In(Ci, Ps) A Az(Pis,B) 人 Ar(C，B) MN» MN At(C», B) 

所 满足 。 当 然 ,置换 必须 用 于 从 当前 状态 引 疝 目标 的 动作 ,产生 解 Upload (Ci， Pis，B)。 

3. 状态 空间 搜索 的 启发 式 

事实 证 明 , 没 有 一 个 好 的 启发 式 函 数 ,无 论 前 向 搜索 ,还 是 后 向 搜索 ,都 不 是 高 效 的 。 
在 STRIPS 规划 中 ,每 个 动作 的 耗 散 是 1, 所 以 距离 是 动作 的 数目 。 基 本 的 想法 是 考虑 动 
作 的 效果 和 必须 到 达 的 目标 ,从 而 猜测 达到 所 有 目标 需要 多 少 个 动作 ,找到 一 个 确切 的 数 
目 是 NP 难题 ,但 是 ,大 部 分 时 候 , 不 需要 太 多 的 计算 就 找到 一 个 合理 的 估计 是 可 能 的 。 
我 们 也 可 能 得 到 一 个 可 采纳 的 启发 式 (一 个 没有 过 高 估计 的 启发 式 ) ,可 以 和 A’ 搜索 一 
起 使 用 ,找到 最 优 解 。 
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可 以 尝试 两 种 方法 : 第 一 种 方法 是 从 给 定 问 题 的 详细 描述 中 得 到 一 个 松弛 问题 , 希 
望 能 够 很 容易 求解 ,松弛 问题 的 最 优 解 耗 散 为 原始 问题 提供 了 一 个 可 采纳 启发 式 ;第 二 个 
方法 是 假设 一 个 纯 分 治 算法 可 行 。 这 被 称 为 子 目 标 独立 性 假设 : 求解 子 目 标 合 取 式 的 耗 
散 可 以 近似 为 独立 地 求解 每 个 子 问题 的 耗 散 的 总 和 。 子 目标 独立 假设 可 能 是 乐观 的 ,也 
可 能 是 翡 观 的 。 当 每 个 子 目标 的 子规 划 间 存在 负 相 互 作 用 时 , 它 是 乐观 的 。 例 如 , 当 一 个 
子规 划 的 动作 删除 了 另 一 个 子规 划 取 得 的 一 个 目标 时 ; 当 子 规划 包含 宛 余 动作 时 ,这 是 悲 
观 的 ,因此 也 是 不 可 采纳 的 。 例 如 ,在 合并 的 规划 中 ,两 个 动作 可 以 被 一 个 单一 动作 所 
替代 。 

考虑 如 何 得 到 松弛 规划 问题 ,既然 能 够 得 到 前 提 和 效果 的 清晰 表示 ,通过 修改 这 些 表 
示 得 到 的 处 理 过 程 就 是 可 行 的 。( 将 这 个 方法 与 搜索 问题 相 比较 ,搜索 问题 中 后 继 函 数 相 
当 于 一 个 黑 盒子 ) 。 最 简单 的 想法 是 通过 将 动作 删除 所 有 前 提 使 问题 得 到 松弛 ,那么 ,每 
个 动作 都 总 是 可 用 的 。 并 且 任 何 文字 都 可 以 一 步 获得 (如 果 有 可 用 的 动作 ,否则 目标 是 不 
可 能 的 )。 这 几乎 意味 着 求解 一 个 目标 合 取 式 所 需 的 步骤 数 就 是 未 满足 的 目标 数 , 因 为 上 
可 能 有 两 个 动作 ,其 中 的 每 一 个 动作 删除 另 一 个 获得 的 目标 文字 ; @ 一 些 动作 可 能 达到 
多 个 目标 。 假 如 把 松弛 问题 和 子 目标 独立 性 假设 结合 起 来 ,这 两 个 问题 都 随 着 假设 而 消 
失 。 产 生 的 启发 式 恰好 是 未 满足 目标 数 。 

在 许多 情况 下 ,至 少 通过 考虑 达到 多 个 目标 的 动作 引起 的 正 相互 作 用 ,能 够 得 到 更 精 
确 的 启发 式 。 首 先 ,通过 删除 负 效 果 进 一 步 松弛 问题 ;接着 ,计算 所 需 动作 的 最 小 数目 ,而 
这 些 动作 的 正 效果 的 并 集 能 够 满足 目标 。 例 如 ,考虑 

Goall(AMABACOC) 

Action(zx, EFFECT: A A P) 

Action(y, EFFECT:BACAQ) 

Action(z, EFFECT: BApAQ) 
履 盖 目标 {A,B,C} 的 最 小 集合 由 动作 {X,Y} 给 出 ,所 以 覆盖 集 启发 式 返回 的 耗 散 值 是 2。 
这 是 子 目标 独立 性 假设 上 的 一 个 改进 ,原来 给 出 的 启发 值 是 3。 虽然 覆盖 集 问题 是 NP 
难题 ,但 这 是 次 要 的 。 一 个 简单 的 贪 禁 覆 盖 集 算法 保证 返回 一 个 处 于 真正 最 小 值 的 log nn 
们 范围 内 的 值 ,其 中 是 目标 中 的 文字 个 数 , 通 常 在 实际 应 用 中 比 这 个 要 好 。 可 是 , 贪 禁 
算法 不 能 保证 启发 式 的 可 采纳 性 。 

也 可 以 通过 只 删除 负 效 果 ,而 不 删除 前 提 生 成 松弛 问题 。 也 就 是 说 ,在 原始 问题 中 ， 
如 果 动 作 的 效果 是 AA 一 B, 那 么 效果 A 将 仍 在 松弛 问题 中 。 这 意味 着 不 用 再 担心 子规 
划 间 的 负 相互 作用 ,因为 没有 动作 能 够 删除 其 他 的 动作 得 到 的 文字 。 产 生 的 松弛 问题 得 
到 的 解 耗 散 带 来 的 启发 式 被 称 为 清空 删除 表 启 发 式 。 这 个 启发 式 是 相当 精确 的 ,但 是 计 
算 它 涉及 实际 运行 一 个 (简单 的 ) 规 划算 法 。 在 实际 应 用 中 ,松弛 问题 的 搜索 通常 很 快 ,这 
个 代价 是 值得 的 。 

这 里 定义 的 启发 式 在 前 进 和 回归 方向 上 都 能 使 用 。 编 写 时 ,使 用 清空 删除 表 启 发 式 
的 前 向 规划 器 保持 领先 。 随 着 新 的 启发 式 和 新 的 搜索 技术 的 研究 ,这 很 可 能 会 发 生变 化 。 
既然 规划 问题 是 指数 级 难度 的 ,没有 算法 会 对 所 有 问题 都 有 效 , 但 是 许多 实际 问题 还 是 可 
以 通过 启发 式 方法 求解 的 。 
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9.3 偏 序 规划 


1. 偏 序 规划 的 描述 
前 向 和 后 向 状态 空间 搜索 是 全 序 ( 完 全 有 序 ) 规 划 搜索 的 特殊 形式 ,它们 只 搜索 与 起 始 
或 目标 直接 相关 的 严格 线性 动作 序列 。 这 意味 着 它们 不 能 利用 问题 分 解 , 它 们 必须 总 是 决 
策 如 何 从 所 有 子 问题 出 发 对 动作 排序 ,而 不 是 单独 处 理 每 个 子 问题 ,我 们 更 愿意 有 一 个 方法 
能 够 独立 地 在 一 些 子 目标 上 进行 ,用 一 些 子规 划 对 它们 求解 ,然后 再 合并 这 些 子规 划 。 
这 种 方法 在 构建 规划 的 次 序 上 也 具有 灵活 性 的 优点 。 也 就 是 说 ,规划 系统 能 够 先进 
行 “ 显 然 的 "和 "重要 的 ”决策 ,而 不 是 被 迫 按 历时 顺序 的 步骤 进行 决策 。 例 如 ,一 个 在 伯 克 
利 的 人 想 去 蒙特 卡 洛 , 他 可 能 先 试图 寻找 从 旧金山 到 巴黎 的 航班 ;得 知 出 发 和 到 达 时 间 ， 
然后 它 就 可 以 继续 想 办 法 如 何 往返 机 场 。 
在 搜索 期 间 延 迟 某 个 选择 的 通用 策略 称 为 最 少 承 诺 策略 。 最 少 承 诺 没 有 形式 化 定 
义 ,显然 某 种 程度 的 承诺 是 必要 的 ,以 免 搜 索 没 有 任何 进展 。 
第 一 个 具体 例子 比 规划 一 个 假期 要 简单 得 多 ,考虑 穿 一 双 鞋 的 简单 问题 ,可 以 把 它 描 
述 为 如 下 的 形式 化 规划 问题 。 
Goal (RightShoeOn MM LeftShoeOn) 
Init () 
Action (RightShoe ,PRECOND: RightSockOn ,EFFECT: RightShoeOn) 
Action (RightSock, EFFECT: RightSockOn) 
Action(LeftShoe ,PRECOND: RightSockOn ,EFFECT: LeftShoeOn) 
Action (LeftSock ,EFFECT: LeftSockOn) 
一 个 规划 系统 应 该 能 够 找到 RighiSock 后 紧 跟着 RightShoe 的 双 动 作 序 列 获得 目标 
的 第 一 个 合 取 子 句 ,找到 LeftSock 后 紧 跟 着 LeftShoe 的 双 动 作 序列 获得 目标 的 第 二 个 
合 取 子 句 , 然 后 这 两 个 序列 可 以 被 合并 而 产生 最 后 的 规划 。 为 了 做 到 这 些 ,规划 系统 会 独 
立 处 理 这 两 个 子 序列 ,而 不 承诺 一 个 序列 中 的 一 个 动作 是 另 一 个 序列 的 动作 之 前 ,还 是 之 
后 。 任 何 能 够 将 两 个 动作 放 在 一 个 规划 中 而 不 指定 哪 一 个 在 前 的 规划 算法 都 称 为 偏 序 规 
划算 法 。 图 9-1 显示 了 鞋子 和 袜子 问题 的 解 的 偏 序 规划 。 注 意 , 解 是 用 动作 图 表示 的 ,而 
不 是 序列 。 同 时 也 注意 称 为 Start 和 Finish 的 * 空 ?动作 ,它们 标记 了 规划 的 开始 和 结束 ， 
偏 序 规划 的 解 相 当 于 6 个 可 能 的 全 序 规划 ,其 中 的 每 一 个 全 序 规划 被 称 为 偏 序 规划 的 线 
性 化 。 
偏 序 规划 (此 后 成 为 规划 ) 可 以 作为 偏 序 规划 空间 的 一 个 搜索 来 实现 。 也 就 是 说 ,从 
一 个 空 规划 开始 。 然 后 考虑 改进 规划 的 途径 ,直到 找到 一 个 能 够 解决 问题 的 完整 规划 。 
这 个 搜索 中 的 动作 并 不 是 现实 世界 中 的 动作 ,而 是 规划 上 的 动作 : 给 规划 增加 一 步 ,通过 
将 一 个 动作 放 到 另 一 个 的 前 面 而 强加 顺序 ,等 等 。 
下 面 定义 偏 序 规划 的 POP 算法 ,将 POP 算法 写成 一 个 独立 程序 是 一 种 惯例 ,但 是 我 
们 把 偏 序 规划 形式 化 表示 为 搜索 问题 的 一 个 实例 。 这 使 我 们 集中 于 可 用 的 规划 改进 步 
又 ,而 不 用 担心 算法 是 如 何 探索 空间 的 。 事 实 上 ,一旦 搜索 问题 被 形式 化 表示 后 ,范围 广 
泛 的 各 种 无 信息 搜索 和 启发 式 搜索 都 可 以 被 运用 。 
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图 9-1 穿 鞋 袜 问 题 的 偏 序 规划 及 其 6 个 线性 化 


注意 ,我 们 搜索 问题 的 状态 是 (大 多 数 是 未 完成 的 ) 规 划 。 为 了 避免 同 现实 世界 中 的 
状态 相 混淆 ,我 们 将 讨论 规划 ,而 不 是 状态 。 每 个 规划 都 有 下 列 4 个 部 分 ,其 中 前 两 个 定 
义 了 规划 的 步骤 ,后 两 个 提供 决定 如 何 扩展 规划 的 记录 功能 。 

(1) 一 组 动作 组 成 规划 的 步骤 : 这 是 从 规划 问题 的 动作 集中 选取 的 。“ 空 "规划 只 包 
含 Start 和 Finish 动作 ,Stiart 动作 没有 前 提 且 将 规划 问题 初始 状态 中 的 所 有 文字 作为 其 
效果 ,Finish 动作 没有 效果 且 将 规划 问题 的 目标 文字 作为 其 前 提 。 

(2) 一 组 定 序 约束 : 每 个 定 序 约束 的 形式 是 A=B, 读 作 *A 在 B 之 前 ”, 它 的 意思 是 
动作 A 必须 在 动作 B 之 前 某 时 刻 执行 ,但 是 并 不 必要 在 紧邻 的 “之 前 ”。 定 序 约束 必须 描 
述 一 个 合适 的 偏 序 ,任何 循环 (如 A 二 B 和 了 一 A) 都 表示 矛盾 。 所 以 ,如 果 会 造成 循环 ， 
该 定 序 约束 就 不 能 添加 到 规划 中 。 


(3) 一 组 因果 连接 。 规 划 中 动作 A 和 B 之 间 的 因果 连接 写 A -二 -B , 读 作 *A 为 B 获 
得 P”。 例 如 ,因果 连接 


RightSockOn 
RightSock —e RightShoe 


断言 RightSockOn 是 动作 RightSock 的 效果 ,同时 是 RightShoe 的 一 个 前 提 。 它 还 断言 
在 从 执行 动作 RighiSock 的 时 刻 到 执行 动作 RighiShoe 的 时 刻 的 这 段 时 期 内 ， 
RightSockOn 必须 保持 为 真 。 换 句 话 说 ,规划 不 能 通过 添加 一 个 与 新 的 因果 连接 冲突 的 
动作 C 扩展 。 如 果 C 产生 效果 ”~ 忆 且 如 果 C 能 够 (根据 定 序 约束 ) 出 现在 A 之 后 B 之 


前 ,那么 动作 C 同 A 一 >B 相 冲突 。 有 人 把 因果 连接 称 为 保护 区 间 , 因 为 连接 A 一 >B 
在 A 到 B 的 区 间 中 保护 P 不 被 否定 。 

(4) 一 组 开放 前 提 。 当 一 个 前 提 不 能 从 规划 的 一 些 动作 中 得 到 时 , 它 是 开放 的 。 在 
不 引入 矛盾 的 情况 下 ,规划 系统 会 致力 于 缩小 开放 前 提 集 合 ,直到 它 成 为 空 集 。 

例如 ,图 9-1 中 的 最 终 规划 有 下 面 这 些 组 成 部 分 (没有 显示 将 任何 其 他 动作 都 放 在 
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Start 之 后 及 Finish 之 前 的 定 序 约束 ) 。 
动作 : {RightSock, RightShoe, LeftiSock, LeftShoe, Start, Finish} 
定 序 : {RightSock 二 RightShoe, LeftSock<LeftShoe} 


RightSockOn LeftSockOn 
连接 : { RightSock ee, RighiShoe, LeftSock nl 


RightShoeOn ,. . LeftShoeOn 
————— Finish, LeftShoe 


开放 前 提 : {) 。 

我 们 将 在 定 序 约束 中 没有 循环 而 且 与 因果 连接 无 冲突 的 规划 定义 为 一 致 性 规划 。 没 
有 开放 前 提 的 一 致 性 规划 是 一 个 解 。 不 难得 到 , 偏 序 解 的 每 个 线性 化 都 是 一 个 从 初始 状 
态 执行 后 最 终 到 达 目 标 状态 的 全 序 解 。 这 意味 着 可 以 把 “执行 规划 ”的 概念 从 全 序 扩展 到 
偏 序 。 一 个 偏 序 蔡 代 一 个 偏 序 规划 是 通过 反复 选用 任何 可 能 的 下 一 个 动作 执行 的 。 后 面 
会 讨论 到 ,Agent 在 执行 规划 时 可 得 到 的 灵活 性 在 现实 世界 不 与 它 协作 时 可 能 非常 有 用 。 
灵活 的 定 序 也 使 得 将 小 规划 合并 到 大 的 规划 中 变 得 更 容易 ,因为 每 个 小 规划 能 够 重新 对 
它 的 动作 排序 ,以 避免 与 其 他 规划 冲突 。 

现在 已 经 准备 好 形式 化 表示 POP 求解 的 搜索 问题 ,我 们 将 从 适合 命题 规划 问题 的 形 
式 化 方法 出 发 ,把 一 阶 的 复杂 情况 留 到 以 后 讨论 ,通常 定义 包括 初始 状态 ,动作 和 目标 
测试 。 

(1) 初始 状态 包括 Start 和 Finish , 定 序 约束 Start 二 Finish, 没 有 因果 连接 ,并 且 将 
Finish 状态 的 所 有 前 提 当 作 开 放 前 提 。 

(2) 后 继 函 数 在 动作 B 上 任意 选取 一 个 开放 前 提 P ,并 为 获得 P 的 动作 A 的 每 个 可 
能 的 一 致 性 选择 方式 产生 一 个 后 继 规 划 。 一 致 性 通过 下 面 的 方法 得 到 加 强 。 


Q@ 因果 连接 A 一 >B 和 定 序 约束 A 二 B 被 添加 到 规划 中 ,动作 A 可 能 是 规划 中 已 经 
存在 的 动作 或 是 新 的 。 如 果 它 是 新 的 ,就 把 它 添加 到 规划 中 ,同时 也 把 Star 上 <A 和 A 二 
Finish 添加 到 规划 中 。 

@ 我 们 解决 新 的 因果 连接 与 所 有 已 经 存在 的 动作 之 间 的 冲突 以 及 动作 A( 如 果 它 是 


新 的 ) 与 所 有 已 经 存在 的 因果 连接 之 间 的 冲突 。A 一 >B 和 C 之 间 冲 突 的 解决 方式 是 使 
C 在 保护 区 间 以 外 的 某 时 刻 发 生 ,通过 添加 B 二 C 或 C 二 A 之 一 :如 果 它 们 导致 一 致 性 规 
划 ,我 们 就 添加 一 个 或 全 部 两 个 后 继 状 态 。 

(3) 目标 测试 是 检验 规划 是 不 是 原始 规划 问题 的 一 个 解 。 由 于 只 生成 了 一 致 性 规 
划 , 目 标 测 试 仅 需要 检验 有 没有 开放 前 提 。 

这 种 形式 化 表示 下 的 搜索 算法 考虑 的 动作 是 规划 改进 步骤 ,而 不 是 来 自 领域 自身 的 
真实 动作 。 因 此 ,路 径 耗 散 是 无 关 的 ,严格 地 说 ,因为 唯一 要 紧 的 是 路 径 引 导出 的 规划 实 
际 动作 的 全 部 耗 散 。 不 过 ,指定 反映 实际 路 径 耗 散 的 路 径 耗 散 函 数 是 可 能 的 : 我 们 把 每 
个 已 添加 到 规划 中 的 实际 动作 计 为 1, 所 有 其 他 改进 步骤 计 为 0。 这 样 ,5(Cz) 将 与 规划 中 
实际 动作 的 数目 相等 ,其 中 是 一 个 规划 ,启发 式 估 计 ACz) 也 可 以 使 用 。 

有 人 可 能 认为 后 继 函 数 需要 包括 每 个 开放 的 PP 的 后 继 ,而 不 只 是 其 中 之 一 。 然 而 ， 
这 会 是 多 余 和 低 效 的 ,因为 与 约束 满足 算法 并 未 包含 每 个 可 能 变量 的 后 继 的 理由 相同 : 
我 们 考虑 的 开放 前 提 的 顺序 是 可 交换 的 。 因 此 ,可 以 选择 任意 顺序 ,并 且 仍然 是 一 个 完备 





LeftShoe, RightShoe 
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算法 。 选 择 一 个 合适 的 顺序 可 以 导致 更 快 的 搜索 ,但 是 所 有 顺序 都 以 同样 的 候选 解 集 而 


目 
口径。 


2. 无 约束 变量 的 偏 序 规划 

本 节 考 虑 当 POP 和 包含 变量 的 一 阶 动作 表示 一 起 使 用 时 可 能 出 现 的 复杂 因素 。 假 
设 有 一 个 积木 世界 问题 

Tnit(On(A, Table) MOn(B, Table) MOn(C, Table) 
MBlock(A) M Block(B) M Block(C) 
MAClear(A) AClear (B) MClear (C)) 
Goal(On(A, B) MAOn(B, C)) 
Action(Move(b, zx, y), 
PRECOND: On(b, x) AClear(b) MClear(y) MN Block(b) 
A BFAT)AN DAY MN (rAy), 
EFFECT: On(b, y) AClear(r) NM "On(b, x) MN 7 Clear(y)) 
Action(MoveToTable(b, zr), 
PRECOND: On(b, x) A Clear(b) MN Block (b) MN (LFAx), 
EFFECT: On(b, Table) AClear(x) NM "On(b, x)) 
它 具 有 开放 前 提 On(A，B) 和 动作 
Action(Move(b, zx, y), 
PRECOND: On(b, x) AClear(b) NClear(y) 
EFFECT: On(b, y) AClear(x) NM TOn(b, x)N 7 Clear(y)) 

这 个 动作 获得 On(A，B) ,因为 效果 On(0，>) 在 置换 {2/A，>/B} 下 与 On(A, B) 合 

一 ,然后 将 这 个 置换 就 用 到 动作 中 ,产生 
Action(Move(A, x+, B), 
PRECOND: On(A, x)AClear(A) A Clear(B) 
EFFECT: On(A, B)AClear(x) AM "On(A, x) A 7 Clear(B)) 

这 里 留 下 变量 z 是 无 约束 的 。 也 就 是 说 ,动作 说 从 某 处 移动 积木 A, 而 不 说 出 具体 从 
何 处 。 下 面 是 最 少 承 诺 原则 的 另 一 个 例子 : 我 们 可 以 推迟 进行 选择 ,直到 规划 中 的 某 个 
其 他 步骤 为 我 们 做 出 选择 。 例 如 ,假设 在 初始 状态 中 有 On(A，D) ,那么 Star 动作 可 用 
来 获得 On(A,z), 把 zx 与 D 绑 定 , 这 种 在 选择 xz 之 前 等 待 更 多 信息 的 策略 通常 比 尝试 x 
的 所 有 可 能 值 并 对 每 个 失败 结果 进行 回溯 的 方法 更 加 有 效 。 

前 提 和 动作 中 变量 的 出 现 ,使 得 发 现 和 解决 冲突 的 过 程 复杂 化 。 例 如 , 当 Move(A， 
工 ，B) 被 添加 到 规划 中 时 ,将 需要 一 个 因果 连接 。 


On(A,B) 
Move(A.z,B) Finish 


如 果 存 在 另 一 个 具有 效果 一 On(A, <) 的 动作 M; ,那么 仅 当 < 是 B 时 ,Mi 才 发 现 冲 
突 。 为 了 容纳 这 种 可 能 性 ,我 们 扩展 规划 的 表示 ,以 包含 一 组 形 如 x 隆 x 的 不 等 式 约束 
(其 中 < 是 变量 ,zx 是 男 一 个 变量 或 一 个 常量 符号 )。 在 这 种 情况 下 ,通过 添加 去 B 解决 
冲突 ,意味 着 未 来 对 规划 的 扩展 可 以 把 = 实例 化 为 除了 B 以 外 的 任何 值 ,任何 时 候 我 们 
把 一 个 置换 用 于 规划 时 ,必须 检验 不 等 式 与 置换 不 冲突 。 例 如 ,包含 z/y 的 置换 与 不 等 
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式 约 束 = 天 > 冲突 。 这 样 的 冲突 无 法 解决 ,所 以 必须 回溯 。 

3. 启发 式 偏 序 规划 

同 全 序 规划 相 比 , 偏 序 规划 的 明显 优点 是 能 够 将 问题 分 解 成 子 问题 。 而 其 不 足 之 处 
是 不 直接 表示 状态 ,所 以 很 难 估计 偏 序 规划 距离 目标 有 多 远 。 目 前 ,对 于 如 何 计算 精确 的 
启发 式 的 研究 成 果 , 偏 序 规划 比 全 序 规划 要 少 。 

最 明显 的 启发 式 是 对 独特 的 开放 前 提 计数 。 这 可 以 通过 减 去 与 Start 状态 中 的 文字 
相 匹 配 的 开放 前 提 个 数 改 进 , 同 全 序 情况 下 一 样 , 当 有 动作 能 获得 多 个 目标 时 ,将 对 耗 散 
估计 过 高 ,而 当 规划 步骤 间 存 在 负 相 互 作用 时 , 则 可 能 对 耗 散 估计 不 足 。 

启发 式 函 数 用 来 选择 哪个 规划 需要 进行 改进 。 给 定 这 个 选择 ,算法 基于 对 单一 开放 
前 提 的 选择 生成 后 继 , 以 使 算法 继续 。 正 如 约束 满足 算法 中 变量 选择 的 情况 ,这 种 选择 在 
效率 上 有 很 大 的 影响 。CPS 的 最 大 约束 变量 启发 式 适合 于 规划 算法 ,并 且 看 起 来 能 良好 
运转 。 这 个 思想 是 选择 能 够 被 满足 并 且 路 径 数 最 少 的 开放 前 提 。 这 个 启发 式 有 两 种 特殊 
情况 。 第 一 ,如 果 一 个 开放 条 件 不 能 被 任何 动作 获得 ,启发 式 会 选中 它 ;这 是 一 个 很 好 的 
思想 。 因 为 尽早 检测 到 不 可 能 性 ,能 够 节省 大 量 的 工作 。 第 二 ,如 果 一 个 开放 条 件 只 能 通 
过 一 条 路 径 获得 ,那么 它 应 该 被 选中 ,因为 结果 是 不 可 避免 的 ,并 且 在 仍 要 进行 的 其 他 选 
择 上 提供 附加 约束 ,虽然 完全 计算 满足 每 个 开放 条 件 的 路 径 数 是 代价 昂贵 的 ,而 且 并 不 总 
是 值得 的 ,但 是 实验 表明 ,处 理 两 类 特殊 情况 会 带 来 实质 性 的 速度 提高 。 


9.4 命题 逻辑 规划 


通过 命题 演算 或 定理 证 明 , 可 以 实现 规划 ,从 人 工 智能 的 初期 ,人 们 就 开始 了 这 方面 
的 研究 ,但 通常 认为 这 个 方法 太 低 效 。 近 年 来 ,在 迎 辑 命题 的 高 效 推理 算法 方面 的 发 展 已 
经 在 以 迎 辑 推理 为 手段 的 规划 领域 有 了 复苏 迹象 。 

本 节 采 用 的 算法 是 基于 逮 辑 语句 可 满足 性 的 测试 ,而 不 是 定理 证 明 。 采 用 下 面 这 样 
的 命题 语句 模型 : 

初始 状态 人 所 有 可 能 的 行为 描述 A 目标 

该 语句 包含 与 每 个 发 生 的 动作 相对 应 的 命题 符号 。 满 足 语句 的 模型 将 给 属于 正确 规 
划 的 一 部 分 的 动作 赋值 true, 而 给 其 他 动作 赋值 false。 如 果 规 划 问 题 不 可 解决 ,那么 语 
句 将 是 不 可 满足 的 。 

把 STRIPS 问题 转换 成 命题 逻辑 的 过 程 是 知识 表示 领域 的 典型 问题 : 从 那些 看 似 合 
理 的 公理 集 出 发 ,会 发 现 这 些 公理 考虑 到 了 廖 误 的 非 预期 模型 ,然后 写 出 更 多 的 公理 。 

以 航空 运输 问题 的 简化 版 本 为 例 , 在 初始 状态 (时 刻 0) ,飞机 Pi 在 SFO, 而 飞机 P， 
在 JFK。 目 标 是 让 P, 在 JFK 并 且 P; 在 SFO, 也 就 是 飞机 互 换 位 置 。 首 先 ,需要 对 时 
间 步 (或 周期 ) 进 行 断言 的 独特 命题 符号 。 我 们 用 上 标 表示 步 数 。 因 此 ,初始 状态 可 以 
写成 

Ai(P1,SFO)" MAi(P,, JFK)" 

其 中 ,Ai(Pi ,SFO)" 是 一 个 原子 谓词 。 因 为 命题 逻辑 没有 封闭 的 假设 ,所 以 还 必须 指定 
在 初始 状态 中 不 为 真 的 命题 。 如 果 某 些 命题 在 初始 状态 中 是 未 知 的 ,那么 它们 可 以 保留 
不 被 指定 。 在 这 个 例子 中 ,我 们 指定 : 


481 





一 一 一 432 


人 工大 能 ( 萝 3 瞩 ) 


"Az(P1,JFKR)" A ~ Ai(P;,SFO)® 
目标 自身 必须 同一 个 特定 的 时 间 步 相关 联 ,既然 我 们 不 知道 获得 目标 要 多 少 步骤 的 先 验 
值 ,那么 可 以 试 着 断言 在 初始 状态 ,时 刻 T= 二 0, 目 标 为 真 。 也 就 是 ,可 以 断言 ArCP,， 
JFK)" Ar(Ps,SFO)" 。 如 果 这 个 失败 ,再 尝试 了 二 1, 以 此 类 推 ,直到 达到 最 小 可 行规 
划 长 度 , 对 T 的 每 个 值 , 知 识 库 只 包含 覆盖 时 间 步 骤 从 0 到 工 的 语句 ,为 了 确保 终止 , 强 
加 一 个 任意 上 限 Ts。 这 个 算法 如 下 。 
Function STAPLAN(problem, T,,) returns solution of failure 
Inputs: problem, a planning problem， 
Twax» an upper limit for length 
for T=0 to Tnx do 
cnf, mapping<-TRANSLATE-TO-SAT(problem, T) 
assignment<-SAT-SOLBER (enf) 
if assignment is not null then 
return EXTRACT-SOLUTION(assignment, mapping) 
return failure 
下 面 的 问题 是 如 何 把 动作 描述 编码 到 命题 迎 辑 中 ,最 直接 的 方法 是 给 每 个 发 生 的 动 
作 一 个 命题 符号 。 例 如 ,如 果 在 时 刻 0 飞机 Pi, 从 SFO 飞 往 JFK ,那么 Fly(Pi ,SFO， 
JFL)" 为 真 。 例 如 ,有 
AtCP ,JEFK) 全 ALCP，JFK)"A 人 一 (FLyCP ,JEFK,SFO)"AAtCP ,JEFK)")) 
V (Fly(P1, SFO,JFK)" AAALCP ,SFO)") (9-1) 
也 就 是 ,如 果 飞 机 Pi 在 时 刻 0 位 于 JFK 并 且 没 有 飞 走 , 或 者 它 在 时 刻 0 位 于 SFO 并 且 
飞 往 JFK ,那么 它 在 时 刻 1 将 在 JFK。 对 每 个 飞机 、 机 场 和 时 间 步 ,我 们 都 需要 一 条 这 
样 的 公理 。 此 外 ,每 个 附加 的 机 场 都 会 添加 旅行 往返 给 定 机 场 的 其 他 途径 ,因此 更 多 的 析 
取 子 句 将 被 添加 到 每 条 公理 的 右边 。 
适当 运用 这 些 规则 ,可 以 运行 可 满足 性 算法 找到 一 个 规划 。 应 该 有 一 个 规划 能 够 在 
时 刻 T=1 时 获得 目标 ,即使 两 架 飞 机 交换 位 置 的 规划 。 现 在 假设 知识 库 是 
初始 状态 人 后 继 状态 公理 人 目标 ? (9-2) 
这 断言 目标 在 时 间 T 二 1 为 真 。 对 于 一 个 赋值 ,使 得 下 列 命题 为 真 
Fly(P1, SFO,JFK)" 和 Ai(P,JFK,SFO)" 
并 使 所 有 其 他 动作 符号 为 假 , 可 以 确认 该 赋值 是 知识 库 的 一 个 模型 。 到 目前 为 止 ,一 切 顺 
利 , 可 满足 性 算法 可 能 返回 其 他 可 能 的 模型 吗 ? 答案 是 否定 的 。 考 虑 用 下 列 动作 符号 制 
定 的 相当 笨拙 的 规划 
Fly (Pi,，SFO,JFKE) ”和 REy (Pi,JFK .SFO)" 和 Fly (CP,JFK,SFO) 
这 个 规划 是 思春 的 ,因为 飞机 P; 从 SFO 出 发 ,所 以 动作 Fly (Pi,JFK,SFO)" 是 不 可 能 
的 。 然 而 ,这 个 规划 是 式 (9-2) 中 的 语句 的 一 个 模型 ! 也 就 是 , 它 与 我 们 迄今 为 止 所 说 关 
于 问题 的 所 有 事物 都 一 致 ,为 了 理解 为 什么 ,需要 更 仔细 地 看 后 继 状 态 公 理 ( 式 (9-1)) 所 
说 的 前 提示 满足 的 动作 。 公 理 正确 地 预言 了 当 这 样 一 个 动作 被 执行 时 不 会 发 生 任何 事 
情 , 但 是 它们 的 确 没 有 说 动作 不 能 被 执行 ! 为 了 避免 用 非法 动作 产生 规划 ,必须 添加 前 提 
公理 规定 发 生 的 动作 要 求 前 提 得 到 满足 。 例 如 ,需要 
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Fly (Pi,JFKR .SFO)MSOAL(P, JFK)' 
因为 Ai(P1, JFK)" 在 初始 状态 中 被 声明 为 假 , 这 条 公理 确保 每 个 模型 也 把 Fly (Pi， 
JFK ,SFO)" 设 为 假 。 通 过 添加 前 提 公 理 , 当 在 时 刻 1 获得 目标 时 ,只 有 一 个 模型 满足 所 
有 的 公理 , 即 飞机 P, 飞 往 JFK、 飞 机 P, 飞 往 SFO 的 模型 ,注意 此 解 有 两 个 并 行 的 动作 。 

当 增 加 第 三 个 机 场 LAX 时 ,会 有 更 多 意外 出 现 。 现 在 ,每 架 飞 机 在 每 个 状态 都 有 两 
个 合法 的 动作 。 当 运行 可 满足 性 算法 时 ,我 们 发 现 拥 有 Fly(Pi,SFO,JFK)"” 和 Fly 
(Ps,JFK,SFO)" 和 Fly (P:,JFK, LAX)" 的 模型 满足 所 有 公理 。 也 就 是 说 ,后 继 状 态 
和 前 提 公 理 允许 一 架 飞 机 同时 飞 往 两 个 目的 地 。P; 两 次 飞行 的 前 提 在 初始 状态 中 都 得 
到 了 满足 ;后 继 状 态 公 理 表 明 在 时 刻 1 ,将 得 到 如 下 了 矛盾 的 命题 集 : Ps 同时 飞 往 SFO 和 
LAX ;进而 使 得 目标 得 到 满足 ,从 而 形成 一 个 虚假 的 规划 解 。 很 明显 ,需要 添加 更 多 的 公 
理 消除 这 类 虚假 的 解 。 一 种 方法 是 添加 动作 排斥 公理 防止 同时 发 生 的 动作 。 例 如 ,可 以 
通过 添加 形 如 

m(CFy (P:,JFK,SFO)" M Fly (P:,JFK,LAX)") 
的 所 有 可 能 公理 坚持 完全 排斥 ;这 些 公 理 确保 没有 两 个 动作 能 够 同时 发 生 。 它 们 消除 了 
所 有 虚假 的 规划 ,但 是 同时 强制 每 个 规划 是 完全 有 序 的 。 这 丧失 了 偏 序 规划 的 灵活 性 ; 同 
时 ,由 于 增加 了 规划 中 时 间 步 的 数目 ,计算 时 间 也 可 能 被 延长 。 

可 以 用 只 要 求 部 分 排斥 替代 完全 排斥 , 即 只 有 当 它 们 互相 干扰 时 , 才 排除 同时 发 生 的 
动作 。 它 们 的 条 件 与 互 斥 动作 的 条 件 一 样 : 如 果 一 个 动作 否定 了 另 一 个 动作 的 前 提 或 效 
果 , 这 两 个 动作 就 不 能 同时 发 生 。 例 如 ,Fly(P;,JFK,SFO)" 和 Fly (P;,JFK,LAX)'" 
不 能 同时 发 生 , 因 为 每 一 个 动作 都 会 否定 男 一 个 动作 的 前 提 。 男 一 方面 ,Fly (Pi ,SFO， 
JFKR)" 和 Fly (Ps,JFK,SFO)" 可 以 同时 发 生 , 因 为 这 两 架 飞 机 不 互相 干扰 。 部 分 排斥 
不 用 强制 进行 完全 排序 ,就 排除 了 虚假 的 规划 。 

排斥 公理 有 时 看 上 去 是 相当 生硬 的 方法 。 我 们 只 是 强调 没有 对 象 能 够 同时 在 两 个 地 
方 ,一 架 飞 机 不 能 同时 飞 到 两 个 机 场 : 

Vpyrsyst ry (At (bz) M At (py)') 
这 个 事实 ,与 后 继 状 态 公理 相 结合 ,暗示 一 架 飞 机 不 能 同时 飞 往 两 个 机 场 ,诸如 此 类 的 事 
实 称 为 状态 约束 。 当 然 ,在 命题 逮 辑 中 ,我 们 不 得 不 写 出 每 个 状态 约束 的 全 部 解释 。 对 机 
场 问题 ,状态 约束 足以 消除 所 有 虚假 规划 。 通 常 ,状态 约束 比 动作 排斥 公理 简洁 得 多 ,但 
是 它们 并 不 总 是 能 从 问题 的 原始 STRIPS 描述 中 容易 地 得 到 。 

总 之 ,可 满足 性 问题 的 规划 可 转化 为 包含 初始 状态 目标、 后 继 状 态 公 理 ,前提 公理 及 
动作 排斥 公理 或 状态 约束 的 语句 集 寻 找 模型 。 可 以 证 明 这 个 公理 集 是 充分 的 ,在 不 再 有 
任何 虚假 的 “ 解 ” 的 意义 上 ,任何 满足 命题 语句 的 模型 都 将 是 原始 问题 的 一 个 有 效 规划 , 即 
规划 的 每 个 线性 化 是 一 个 能 达到 目标 的 合法 动作 序列 。 

基于 可 满足 性 的 规划 器 能 够 处 理 大 规模 规划 问题 ,如 找到 拥有 许多 块 积 木 的 积木 世 
界 规划 问题 的 最 优 30 步 解 。 命 题 编码 的 规模 和 解 的 耗 散 是 高 度 依赖 于 问题 的 ,但 是 在 大 
部 分 情况 下 ,存储 命题 公理 需要 的 内 存 是 瓶 天。 从 这 个 工作 中 的 一 个 有 趣 发 现 是 在 求解 
规划 问题 上 ,诸如 DPLL 这 样 的 回溯 算法 往往 比 诸如 WALKSAT 这 样 的 局 部 搜索 算法 
更 好 。 这 是 因为 命题 公理 的 大 部 分 是 霍 恩 (Horn) 子 句 用 单元 传播 技术 处 理 是 十 分 有 效 
的 。 这 个 观察 结果 导致 把 某 些 随机 搜索 与 回顾 以 及 单元 传播 结合 起 来 的 混合 算法 的 
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发 展 。 
9.5 分 层 任务 网 络 规划 


处 理 复杂 软件 的 一 个 最 普遍 的 想法 是 分 层 分 解 。 复 杂 软 件 从 子 程序 或 对 象 类 的 层次 
体系 创建 出 来 。 军 队 作 为 单位 的 等 级 体系 而 运转 ,政府 和 企业 有 部 门 、 子 部 门 和 分 支 办 公 
室 的 分 层 体系 。 层 次 结构 的 关键 好 处 是 ,在 每 一 层 上 ,一 个 计算 任务 、 军 事 任务 或 管理 功 
能 都 被 还 原 为 下 一 个 较 低层 次 的 少量 动作 ,所 以 对 当前 问题 寻找 正确 的 方法 安排 这 些 动 
作 的 计算 消耗 是 小 的 。 另 外 , 非 层 次 方法 将 一 个 任务 还 原 为 大 量 单个 动作 ;对 大 规模 问 
题 , 这 是 完全 不 切实 际 的 。 在 最 好 情况 下 一 一 当 高 层 的 解 总 有 令 人 满意 的 低层 实现 
时 一 一 分 层 方法 能 够 产生 线性 时 间 ,而 不 是 指数 时 间 的 规划 算法 。 

本 节 描 述 基 于 分 层 任务 网 络 或 缩写 为 HTN 的 规划 方法 。 这 个 方法 将 来 自 偏 序 规划 
的 思想 和 众所周知 的 "HTN 规划 ?领域 的 思想 结合 在 一 起 ,在 HTN 规划 中 ,用 来 描述 问 
题 的 初始 规划 被 视 为 对 需要 做 什么 的 非常 高 层 的 描述 。 例 如 ,建造 一 幢 房 屋 ,通过 应 用 动 
作 分 解 改进 规划 。 每 个 动作 分 解 将 一 个 高 层 动作 还 原 为 一 个 低层 行为 的 偏 序 集 。 因 此 ， 
动作 分 解 包含 了 关于 如 何 实现 动作 的 知识 。 例 如 ,建造 一 幢 房 屋 可 以 还 原 为 获得 一 张 许 
可 证 .雇用 一 名 承包 人 进行 建筑 、. 付 钱 给 承包 人 (图 9-2 显示 了 这 样 一 个 分 解 )。 过 程 继 
续 进行 ,直到 规划 中 只 剩 下 原始 动作 。 典 型 地 ,原始 动作 是 那些 Agent 能 够 自动 执行 的 
动作 。 对 一 名 一 般 的 承包 人 而 言 ,“ 安 置 景观 美化 ”可 能 是 原始 的 ,因为 它 只 涉及 叫 来 景观 
美化 承包 人 ,对 于 景观 美化 承包 人 ,诸如 “在 这 里 种 植 杜 鹏 花 ” 这 样 的 动作 可 能 被 认为 是 原 
始 的 。 








Land | 建造 房屋 | House 











获得 许可 上 
雇用 施工 人 员 - 


图 9-2 ”对 房屋 建造 行动 的 一 个 可 能 的 分 解 
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在 纯 “HTN” 规 划 中 ,规划 只 由 相继 的 动作 分 解 产 生 。 因 此 ,HTN 将 规划 视 为 使 动作 
描述 更 具体 化 的 过 程 ,而 不 是 (如 同 状 态 空间 和 偏 序 规划 中 的 情况 那样 ) 一 个 从 空 动作 开 
始 构建 动作 描述 的 过 程 。 这 表明 每 个 STRIPS 动作 描述 都 能 够 被 转变 成 一 个 动作 分 解 ， 
且 偏 序 规划 可 以 被 看 成 纯 HTN 规划 的 一 种 特殊 情况 。 然 而 ,对 于 特定 任务 一 一 尤其 是 
“新 颖 ”的 合 取 式 目标 一 一 纯 HTN 规划 的 视点 相当 不 自然 ,这 样 我 们 更 喜欢 用 混合 方法 ， 
除了 建立 开放 条 件 和 通过 添加 定 序 约束 解决 冲突 的 标准 操作 外 ,动作 分 解 被 用 作 偏 序 规 
划 中 的 规划 改进 (将 HTN 规划 看 作 偏 序 规划 的 扩展 具有 额外 的 优点 ,我 们 可 以 使 用 相同 
的 符号 约定 ,而 不 是 引入 一 个 全 新 的 集合 )。 我 们 从 更 详细 的 描述 动作 分 解 开始 。 然 后 解 
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释 必须 如 何 修改 偏 序 规划 算法 ,以 处 理 分 解 。 最 后 讨论 完备 性 复杂 度 和 实用 人 性 的 问题 。 
动作 分 解 方法 的 一 般 描 述 被 存储 在 规划 库 中 ,它们 被 从 库 中 抽取 出 来 并 被 实例 化 ,以 
满足 正在 被 构建 的 规划 的 需求 。 每 个 方法 是 一 个 形 如 Decompose(a,d) 的 表达 式 。 这 表 
明 动 作 能 够 被 分 解 为 规划 4 , 它 被 表示 为 一 个 偏 序 规划 。 
建造 一 幢 房 子 是 一 个 精细 而 具体 的 例子 ,所 以 我 们 用 它 说 明 动 作 分 解 的 概念 。 图 9-2 
描绘 了 将 Build House( 制 造 房 屋 ) 动 作 分 解 成 4 个 低层 动作 的 可 能 分 解 。 下 面 是 显示 了 
领域 的 一 些 动作 描述 ,以 及 Build House 的 分 解 出 现在 蔡 代 库 中 的 样子 ,规划 库 中 也 许 存 
有 其 他 可 能 的 分 解 。 
Action(BuyLand, PRECOND: Money, EFFECT: LandA 人 一 Money) 
Action(GetLoan, PRECOND: GoodCredit, EFFECT: Money \ Mortage) 
Action( Build House, PRECOND: Land, EFFECT: House) 


Action(GetPermit, PRECOND: Land, EFFECT: Permit) 

Action( HireBuilder, EFFECT: Contract) 

Action ( Construction, PRECOND: Permit 人 Contract, EFFECT: HouseBuild 人 
7 Permit) 

Action(PayBuilder, PRECOND: Money \ HouseBuild, EFFECT: ~ Money \ House N\ 


7 Contract) 


Decom pose( Build House, 
Plan (Steps: {S11: GetPermit, S»: HireBuilder, S3: Construction, S4: 
PayBuilder}, 
ORDERINGS: {Start <S,<S;<S, <Finish, Start <S,<S,}, 


Money Permit 


LINKS{ Start Zes,，Siart =“S,，S， “Sss 





Contract HouseBuilt House  . . 
SS >»S3, Ss >S4，S4 >Finish, 





Tmoney 


SS Finish })) 

分 解 的 Start 动作 为 在 规划 中 没有 其 他 动作 提供 前 提 的 动作 提供 所 有 前 提 。 我 们 称 
此 为 外 部 前 提 。 在 我 们 的 例子 中 ,分 解 的 外 部 前 提 是 Land 和 Money。 类 似 地 ,Finish 的 
前 提 的 外 部 效果 是 所 有 在 规划 中 未 被 其 他 动作 否定 的 动作 效果 。 在 我 们 的 例子 中 ， 
Build House 的 外 部 效果 是 House 和 一 Money。 某 些 HTN 规划 器 也 区 分 诸如 House 的 
初级 效果 和 诸如 一 Money 的 次 级 效果 。 只 有 初级 效果 , 才 可 能 被 用 来 获得 目标 ,而 两 种 
类 型 的 效果 都 可 能 引进 与 其 他 动作 冲突 ,这 能 极 大 地 缩小 搜索 空间 。 

分 解 应 该 是 动作 的 一 个 正确 实现 ,如 果 已 知 a 的 前 提 , 规 划 d 对 于 获得 a 的 效果 的 问 
题 是 一 个 完备 且 一 致 的 偏 序 规划 , 则 规划 a 正确 地 实现 了 动作 4a。 显然 ,如 果 分 解 是 运行 
一 个 可 靠 偏 序 规划 器 的 结果 , 它 就 是 正确 的 。 

规划 库 可 以 包含 对 一 个 高 层 动作 的 多 种 分 解 方 法 。 例 如 ,BuildHouse 可 以 有 另 一 种 
分 解 方法 , 它 描述 了 Agent 是 如 何 空 手 用 石头 和 泥炭 建造 房子 的 。 每 个 分 解 方 法 都 应 该 
描述 一 个 顺序 正确 的 规划 ,此 外 , 它 能 够 为 高 层 动作 描述 额外 需要 附加 的 前 提 和 效果 。 例 
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如 ,图 9-2 的 BuildHouse 表明 了 该 分 解 方 法 除了 Land 以 外 ,还 需要 Money, 并 将 产生 效 
果 一 Money。 相 对 而 言 , 尝 试 自己 建造 的 分 解 方 法 不 以 钱 (Money) 为 前 提 , 但 该 方法 却 需 
要 已 备 好 的 Rocks( 石 头 ) 和 Turf (泥炭 ) ,而 满足 这 两 个 前 提 或 可 导致 建造 人 背 伤 (Bad 
Back ) 的 效果 。 

给 定 一 个 高 层 动作 ,如 BuildHouse, 存 在 几 种 可 能 的 分 解 ,在 它 的 STRIPS 动作 描述 
中 隐藏 那些 分 解 的 某 些 前 提 和 效果 是 不 可 避免 的 ,高 层 动 作 的 前 提 应 该 是 其 分 解 的 外 部 
前 提 的 交集 , 它 的 效果 应 该 是 分 解 的 外 部 效果 的 交集 。 换 个 角度 说 ,高 层 前 提 和 效果 保证 
是 每 个 原始 实现 的 真 值 前 提 和 效果 的 子 集 。 

信息 隐藏 的 两 种 其 他 形式 应 该 被 注意 到 : 第 一 ,高 层 描述 完全 忽视 了 分 解 的 所 有 内 
部 效果 。 例 如 ,我 们 的 BuildHouse 分 解 包 含 时 序 的 内 部 效果 Permit (许可 证 ) 和 
Contract( 合 同 )。 第 二 ,高 层 描述 没有 详细 说 明 动 作 “ 内 部 ”的 时 间 区 间 , 在 其 间 高 层 前 提 
是 必须 成 立 的 效果 ,例如 ,Land( 土 地 ) 前 提 必 须 只 能 为 真 (在 我 们 非常 近似 的 模型 中 ) , 直 
到 GetPermit( 得 到 许可 证 ) 完 成 。 只 有 在 PayBuilder( 支 付 施 工人 员 ) 完 成 之 后 , House 
才 为 真 。 

如 果 要 用 分 层 规划 减 小 复杂 度 , 这 种 类 型 的 信息 隐藏 是 根本 的 。 我 们 需要 能 够 对 高 
层 动作 进行 推理 ,而 不 需要 实现 的 种 种 细节 。 然 而 ,有 必须 负担 的 代价 。 例 如 ,一 个 高 层 
动作 的 内 部 条 件 和 另 一 个 的 内 部 动作 之 间 可 能 存在 冲突 ,但 是 没有 办 法 从 高 层 描述 检测 
它 。 这 个 问题 对 HTN 规划 算法 有 重要 含义 。 简 言 之 ,尽管 原始 动作 可 以 被 规划 算法 视 
为 点 事件 ,高 层 动 作 仍然 具备 时 序 范围 ,在 这 范围 内 各 种 事情 都 可 能 发 生 。 


9.6 非 确 定性 规划 


到 目前 为 止 ,我 们 只 考虑 了 经 典 规划 领域 。 它 们 是 完全 可 观察 的 .静止 的 和 确定 性 
的 。 此 外 ,我 们 已 经 假设 动作 描述 是 正确 而 且 完 备 的 。 在 这 些 情 况 下 ,Agent 能 够 先 规 
划 , 然 后 * 闭 上 眼睛 ”执行 规划 。 另 一 方面 ,在 一 个 不 确定 的 环境 中 ,Agent 必须 用 它 的 感 
知 发 现 当 执行 规划 时 发 生 了 什么 ,以 及 当 一 些 意 外 的 事情 发 生 时 对 规划 可 能 进行 的 修改 
或 替换 。 

Agent 不 得 不 处 理 不 完备 和 不 正确 的 信息 。 不 完备 性 的 产生 是 因为 世界 是 部 分 可 观 
察 的 、 非 确定 性 的 ,或 者 两 者 都 是 。 例 如 , 通 往 办 公 室 储备 间 的 门 可 能 锁 着 ,也 可 能 没 锁 ， 
如 果 它 被 锁 着 ,我 的 一 把 钥匙 可 能 打 得 开 , 也 可 能 打 不 开门 ;我 可 能 知道 ,也 可 能 不 知道 在 
我 的 知识 里 的 这 种 不 完备 性 。 因 此 ,我 的 对 世界 的 模型 是 不 充分 的 ,不 过 是 正确 的 。 另 一 
方面 ,不 正确 性 的 产生 是 因为 世界 不 必 匹 配 我 的 世界 模型 。 例 如 ,我 可 能 相信 我 的 钥匙 能 
够 打开 储备 间 ,但 是 如 果 门 锁 已 经 被 更 换 , 那 么 我 就 是 错误 的 。 没 有 处 理 不 正确 信息 的 能 
力 , 一 个 Agent 最 终 将 像 晓 螂 一 样 缺 乏 智 能 ,这 种 甲虫 会 努力 地 用 类 球 堵 住 它 的 窝 ,即使 
在 粪 球 已 经 从 它 的 掌握 中 拿 走 以 后 。 

获得 完备 或 正确 的 知识 的 可 能 性 取决 于 世界 有 多 少 不 确 定性 。 在 有 界 不 确定 性 的 条 
件 下 ,动作 能 够 有 不 可 预知 的 效果 ,但 是 可 能 效果 可 以 在 动作 描述 公理 中 列 出 。 例 如 , 当 
我 们 掷 硬币 时 ,说 “结果 会 是 正面 (heads) 或 背面 (tails) 是 合理 的 。 通 过 使 规划 能 够 在 所 
有 可 能 的 环境 中 都 可 行 ,Agent 可 以 应 付 有 界 不 确定 性 。 另 一 方面 ,在 无 界 不 确定 性 的 条 
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件 下 ,可 能 的 前 提 或 效用 集 要 么 是 未 知 的 ,要 么 太 大 而 不 能 完全 枚 举 。 这 是 在 类 似 驾 驶 、 
经 济 规划 和 军事 战略 这 样 的 非常 复杂 或 动态 领域 中 的 状况 。 只 有 当 Agent 准备 好 修改 
它 的 规划 和 /或 知识 库 时 , 它 才能 处 理 无 界 不 确定 性 。 无 界 不 确定 性 与 通过 列举 现实 世界 
动作 的 所 有 前 提 而 获得 预期 效果 的 不 可 能 性 有 密切 的 关系 。 

有 4 种 处 理 不 确定 性 的 规划 方法 。 前 两 种 适合 有 界 不 确定 性 ,后 两 种 适合 无 界 不 确 





定性 。 
(1) 无 传 感 规划 : 也 称 为 一 致 性 规划 ,这 种 方法 构造 无 感知 地 执行 的 标准 串 行 规划 。 
无 传 感 规划 算法 要 确保 规划 在 各 种 可 能 环境 中 获得 目标 ,不 管 真实 的 初始 状态 和 实际 的 
动作 结果 是 什么 。 无 传 感 规划 依赖 于 强制 一 一 世界 能 够 被 强制 进入 一 个 给 定 状 态 的 思 
想 ,即使 当 Agent 只 有 关于 当前 状态 的 部 分 信息 时 。 强 制 并 不 总 是 可 能 的 ,所 以 无 传 感 
规划 常常 并 不 实用 。 

(2) 条 件 规划 : 也 称 为 偶发 性 规划 ,这 种 方法 通过 对 可 能 出 现 的 不 同 的 偶发 性 构造 
具有 不 同 分 支 的 条 件 规划 处 理 有 界 不 确定 性 。 正 如 经 典 规划 中 那样 ,Agent 先 规划 ,然后 
执行 产生 的 规划 。Agent 通过 在 规划 中 包含 感觉 动作 ,以 测试 合适 的 条 件 , 从 而 找 出 应 该 
执行 哪 部 分 规划 。 例 如 ,在 机 场 运输 领域 ,我 们 可 以 有 “检查 SFO 机 场 是 否 在 运转 。 如 果 
是 , 飞 往 哪里 ;否则 , 飞 往 Oakland” 的 规划 。 

(3) 执行 监控 和 重新 规划 : 在 这 种 方法 中 ,Agent 能 够 使 用 前 述 的 任何 一 种 规划 技术 
(经 典 的 、 无 传感器 的 或 条 件 的 ) 构 造 一 个 规划 ,但 是 它 也 用 执行 监控 判断 规划 是 不 是 当前 
实际 情景 的 预定 措施 或 者 需要 被 修改 。 当 出 现 错误 时 ,发 生 重 新 规划 。 按 这 种 方式 ， 
Agent 能 够 处 理 无 界 不 确定 性 。 例 如 ,即使 重新 规划 Agent 没有 预见 到 SFO 被 关闭 的 可 
能 性 ,但 是 当 这 发 生 时 , 它 能 认识 到 这 种 情景 并 再 次 调用 规划 器 寻找 一 条 到 达 目 标的 新 
路 径 。 

(4) 持续 规划 : 迄今 为 止 我 们 看 到 的 所 有 规划 器 都 被 设计 用 于 获得 一 个 目标 ,然后 
停止 。 一 个 持续 规划 器 被 设计 成 终生 持续 的 。 它 能 处 理 环 境 中 的 不 可 预料 的 情况 ,即使 
这 些 发 生 在 Agent 构造 规划 的 过 程 中 。 它 通过 目标 形式 化 也 能 处 理 目 标的 放弃 和 附加 
目标 的 创建 。 

下 面 用 一 个 例子 阐明 各 种 类 型 Agent 之 间 的 不 同 。 问 题 是 这 样 的 : 给 定 初始 状态 ， 
有 一 把 椅子 、 一 张 桌 子 和 几 饶 油漆 ,在 每 件 物品 都 不 知道 颜色 的 情况 下 ,获得 椅子 和 桌子 
有 相同 颜色 的 状态 。 

经 典 规划 Agent 不 能 处 理 这 个 问题 ,因为 初始 状态 不 是 完全 指定 的 一 一 我 们 不 知道 
家 具 是 什么 颜色 的 。 

无 传 感 规划 Agent 必须 找到 一 个 在 执行 规划 期 间 不 需要 任何 传感器 的 规划 。 解 是 
能 够 打开 任何 油漆 并 把 它 用 于 椅子 和 桌子 上 ,这 样 强 制 它们 成 为 同一 种 颜色 (即使 Agent 
不 知道 是 什么 颜色 ) 。 当 命题 是 代价 昂贵 的 或 不 可 能 感知 的 时 候 ,强制 是 最 合适 的 。 例 
如 ,医生 经 常 开 广 谱 抗生素 ,而 不 是 使 条 件 规划 : 先进 行 血 液 测试 ,然后 等 着 结果 出 来 ,再 
开 更 特效 的 抗生素 。 他 们 之 所 以 这 么 做 ,是 因为 执行 血液 测试 涉及 的 延迟 和 开销 通常 
太 大 。 

条 件 规划 Agent 能 够 产生 一 个 更 好 的 规划 : 首先 感觉 桌子 和 椅子 的 颜色 ;如 果 它 们 
已 经 是 同样 的 ,那么 规划 完成 。 如 果 不 是 ,感觉 油漆 缸 上 的 标签 : 如 果 有 一 个 饶 的 颜色 跟 
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其 中 一 件 家 具 的 颜色 一 样 , 那 么 把 这 缸 油 漆 用 到 另 一 件 家 具 上 ,和 否则 用 任何 一 种 颜色 漆 两 
件 家 具 。 

重新 规划 Agent 能 够 产生 和 条 件 规划 器 相同 的 规划 ,或 者 它 能 在 最 初 产生 更 少 的 分 
支 , 在 执行 期 间 需 要 时 再 填 人 其 他 分 支 。 它 也 能 处 理 其 动作 描述 的 不 正确 性 。 例 如 ,假设 
Paint(obj，color) 动 作 被 相信 有 确定 性 的 效果 Color(Cobj ,color) 。 条 件 规划 器 只 是 假设 一 
旦 动作 被 执行 ,效果 就 会 发 生 , 但 是 重新 规划 Agent 要 检验 效果 ,如 果 它 不 正确 (可 能 是 
因为 Agent 粗心 而 错过 了 一 点 ) ,那么 它 能 重新 规划 再 漆 这 一 点 。 

持续 规划 Agent 除了 处 理 不 可 预料 的 事件 外 ,能 够 适当 地 修改 规划 ,如 果 把 “在 桌子 
上 用 和 餐 ” 添 加 到 目标 中 ,那么 油漆 规划 必须 被 推迟 。 

在 真实 世界 中 ,Agent 使 用 这 些 方法 的 组 合 。 汽 车 制造 厂商 出 售 备用 轮胎 和 保险 气 
上 时, 这 是 设计 用 于 处 理 刺 破 或 碰撞 的 条 件 规划 分 支 的 实际 体现 ; 男 一 方面 ,许多 汽车 驾驶 
员 从 来 没有 考虑 过 这 种 可 能 性 ,所 以 他 们 对 刺 破 和 碰撞 的 反应 就 如 同 重新 规划 Agent。 
一 般 而 言 ,Agent 只 为 那些 具有 重要 后 果 和 不 可 忽略 出 错 机 会 的 偶发 事件 构造 条 件 规划 。 
因此 ,一 个 期 望 横 穿 撒哈拉 沙漠 旅行 的 汽车 驾驶 员 会 仔细 地 考虑 汽车 抛锚 的 可 能 性 ,而 去 
超市 的 旅行 则 需要 较 少 的 预先 规划 。 


9.7 时 态 规划 


前 述 的 规划 模型 建立 在 一 个 较 严格 的 假设 上 ,包括 忽略 动作 的 持续 时 间 、 忽 略 规划 过 
程 所 需 的 资源 .忽略 世界 模型 可 能 由 外 部 因素 引发 的 变化 。 然 而 ,在 多 数 实际 环境 中 , 动 
作 的 执行 需 持续 一 定 长 度 的 时 间 ,动作 的 执行 都 或 多 或 少 消耗 某 类 资源 ,而且 可 能 生产 其 
他 资源 ,世界 模型 可 能 随 着 时 间 发 生 一 些 可 预期 的 变化 。 下 面 介 绍 的 时 态 规划 模型 主要 
面向 具有 上 述 特征 的 实际 问题 。 本 节 首 先 介绍 该 模型 的 重要 概念 ,而 后 简要 介绍 相应 的 
规划 方法 ,相关 的 技术 细节 请 查阅 附录 中 的 参考 文献 。 

定义 9.1 时 态 规划 问题 (Temporal Planning，TP) 表 示 为 6 元 组 了 =(V,A,T,G， 
TL,6) ,其 中 : 

(1) V 由 两 个 不 相交 的 有 限 变 量 集 组 成 : Vi UVw ,变量 的 取 值 可 随时 间 变 化 。V' 为 
( 迎 辑 ) 命 题 变量 集 ,/E Vi 的 值 域 为 Ran(/) 二 1{T,F}) ;Vw 为 数值 变量 集 ,zEVw 有 值 域 
Ran(CZz)SR。 

(2) A 为 动作 集 : 动作 a€A 具有 形式 (dur,,C,,E,),dur, ER 为 a 的 持续 时 间 ;C。 
为 a 的 执行 条 件 集合 (简称 为 条 件 集 ) ,描述 动作 a 在 开始 执行 时 、 执 行 过 程 中 、 执 行 结束 
前 所 需 的 条 件 ;E。 为 a 的 执行 效果 集合 (简称 为 效果 集 ) ,包含 动作 a 在 开始 执行 时 、 结 束 
执行 时 产生 的 效果 。 对 于 条 件 cE C., 如 果 它 约束 逻辑 变量 , 则 有 形式 和 二 (stv ,et.)v= 
d>>,dERan(u) ,如 果 它 约束 数值 变量 , 则 有 形式 二 (stv ,et.)v op exp 二 ,opE 1{ 记 ,三 ， 
二 ,三 ,二 二 ) ,exp 为 数值 变量 和 常量 组 成 的 表达 式 。st. 和 et, 分 别 为 条 件 c 的 开始 时 间 
和 结束 时 间 。 对 于 效果 ef € E, ,如 果 它 影响 逻辑 变量 , 则 具有 形式 二 [tjv<-d 放 ,如 果 它 影 
响 数 值 变量 , 则 有 形式 二 [4]v eop exp 记 ,eopE1{ 二 ,十 二 ,一 二 ,x 二 ,/ 二 }。1 为 效果 ef 
发 生 的 时 间 。 

(3) I 为 规划 任务 的 初始 状态 , 它 为 /EV 赋予 真 值 *T” 或 “F”, 为 z-EVu 赋予 dE 
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Ran(Cz) 。 

(4) G 为 目标 集 , 其 中 每 个 目标 命题 具有 形式 一 /一 >, 其 中 /ETV。 

(5) TL 为 “定时 触发 文字 ”的 有 限 集 , 其 中 每 个 定时 触发 文字 的 形式 为 [1]f= 二 4 二， 
表示 变量 /EV 在 时 刻 1 的 取 值 更 新 为 4 。 

(6) 9:A-~R 为 动作 的 代价 函数 ,表示 执行 a 需 付 出 的 代价 。 

对 动作 的 时 间 语 义 进 一 步 说 明 如 下 。 将 动作 a 的 开始 执行 时 刻 和 结束 时 刻 分 别 记 为 
st。 和 et 。 对 于 动作 执行 条 件 cE C. ,如 果 st 王 et 一 sk , 则 要 求 条 件 c 在 a 的 开始 时 刻 成 
立 , 称 此 类 条 件 为 动作 a 的 “开始 条 件 ”; 如 果 st. 三 et. 三 et, 则 要 求 条 件 c 在 a 的 结束 时 刻 
成 立 , 称 此 类 条 件 为 动作 a 的 “结束 条 件 ”; 如果 st. 二 st, ,et 一 et , 则 要 求 条 件 c 在 时 间 区 间 
(sts ,ets ) 成 立 , 称 此 类 条 件 为 动作 a 的 “持续 条 件 ”。 动 作 a 对 于 wvEV 的 效果 二 [4jv<-d 记 ， 
如 果 满 足 :二 st,, 则 该 效果 在 动作 的 开始 时 刻 发 生 , 称 此 类 效果 为 “开始 效果 ”; 如 果 满 足 
1 二 ets, 则 该 效果 在 动作 的 结束 时 刻 发 生 , 称 此 类 效果 为 “结束 效果 ”。T 可 表示 逻辑 命题 
变量 随 外 部 事件 的 变化 。 

给 定 一 个 具体 的 TP 问题 , 它 的 一 个 状态 s 由 若干 变量 赋值 组 成 。 用 (Cu 表示、 对 变 
量 wv 的 赋值 , 则 s(v) ERan(v)。 状 态 可 以 仅 对 部 分 变量 进行 赋值 ,此 类 状态 称 为 “部 分 状 
态 ”(partial state)。 对 所 有 变量 均 赋 值 的 状态 称 为 “完全 状态 ”(full state) 。 

定义 9.2 (动作 在 状态 上 的 可 执行 ) 在 状态 ;上 ,如 果 动 作 a 的 “开始 条 件 ” 在 时 刻 
sts 成 立 “ 结 束 条 件 ” 在 时 刻 et 成立“ 持续 条 件 ” 在 区 间 (st, ,ets。) 上 成 立 , 则 称 a 在 3s 上 
可 执行 , 记 为 applicable(a,s)。 

状态 ;上 可 执行 的 所 有 动作 记 为 app_actions(s) 二 {ala€A,applicable(a,s))。 动 作 
a 在 s 上 执行 后 的 状态 记 为 exec(s,a) ,计算 exec(s,a) 的 方法 为 : 在 sv 时刻, 按照 a 的 
“开始 效果 ”更 新 得 到 新 状态 ,在 el。 时刻, 按照 a 的 “结束 效果 ”更 新 ;得 到 s”。 使 用 
x=(<i(a) aiydur > ,<i(a) ,asdur > <i(an) anduro, >) 表 示 一 个 动作 序 
列 , 其 中 a; 为 第 i 步 执行 的 动作 ,i(a;) 为 a; 的 执行 时 刻 ,dur。 为 ai; 的 持续 时 间 。 

定义 9.3 (有 效 动作 序列 ) 如 果 x 中 的 动作 在 状态 * 可 依次 执行 , 则 称 «为 s 上 的 
“有 效 动 作 序 列 ”。 

定义 9.4 ”如果 为 初始 状态 工 上 的 有 效 动作 序列 ,并 且 执 行 as 后 的 状态 满足 目标 
集 G 的 全 部 目标 , 则 称 x 为 TP 问题 [二 (V.,A,T,G,TL,Es,60) 的 规划 方案 (或 称 “ 规 划 
解 ”, 也 称 “ 规 划 ”)。 通 常 ,一 个 TP 问题 的 规划 解 不 止 一 个 , 记 这 些 规划 解 的 集合 为 
Solutions( ll), 

x 的 “时 间 跨 度 ”(make span) 为 ms(r) 一 上 Caw) 十 dur 。 

x 的 代价 为 6(x) 二 》) 6(ai)。x 对 不 可 再 生 资 源 工 的 消耗 量 为 在 时 刻 ms(x) 上 zx 的 
取 值 与 在 初始 状态 IT 中 xz 取 值 的 差 。 根 据 * 时 间 跨 度 ”“ 动 作 代价 ”“ 资 源 消耗 ”等 指标 可 比 
较 两 个 规划 解 x 和 x 的 “规划 质量 "(plan quality) 优 劣 。 

面向 一 个 具体 的 规划 指标 ,可 要 求 规划 算法 计算 出 最 优 的 规划 解 , 或 者 要 求 计算 出 一 
个 令 人 满意 的 规划 解 。 前 一 类 计算 问题 称 为 “最 优 规划 问题 "(optimal planning) ,后 一 类 
问题 称 为 “满意 规划 问题 ”(satisficing planning) 。 

下 面 首先 给 出 月 面 巡 视 器 行为 规划 问题 的 一 个 简化 实例 ,之 后 介绍 如 何 采 用 TP 模 
型 建 模 本 实例 。 假 定 月 面 上 有 两 个 停泊 点 A 和 B ,巡视 器 当前 位 于 A, 其 任务 目标 是 在 B 
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处 完成 探测 工作 。 巡 视 器 当前 能 量 为 80, 在 相对 时 刻 30 开始 处 于 太阳 光照 区 域 。 
任务 约束 为 : 


在 执行 探测 动作 之 前 巡视 器 的 能 量 应 大 于 50。 

在 探测 动作 的 执行 过 程 中 应 一 直 处 于 太阳 光照 区 域 。 

从 A 移动 到 已 要 求 当前 能 量 大 于 40 ,持续 时 间 为 10, 能 量 消耗 为 30。 

在 B 处 进行 探测 动作 要 求 当前 能 量 大 于 30, 持 续 时 间 为 15, 能 量 消耗 为 20。 


此 规划 实例 在 时 间 跨 度 上 的 最 优 解 为 : 在 时 刻 0 执行 从 A 到 B 的 “移动 动作 ”, 在 时 
刻 30 执行 “探测 动作 ”。 

运用 定义 9.1 的 TP 模型 对 上 述 实 例 进行 建 模 ,具体 过 程 如 下 。 建 立 迎 辑 变 量 集 
二 {at_A,at_B,reachable_A_B,in_sun,work_done)}。 各 逻辑 变量 的 含义 如 下 。 


用 工 和 F 表示 逻辑 * 真 ”和 逻辑 * 假 ”。 

at_A 二 TT 表示 巡视 器 在 停泊 点 A。 

at_B==F 表示 巡视 器 不 在 停泊 点 B。 
reachable_A_B=T 表示 停 泊 点 A 在 空间 上 可 达 B。 
in_sun 王 T 表示 巡 视 器 处 于 光照 范围 内 。 
work_done 王 下 表示 探测 工作 未 完成 。 


建立 设 数值 变量 集 Vu 二 {energy) ,变量 energy 建 模 巡 视 器 的 电量 值 。 

初始 状态 三 {at_LA=T, at_B==F, reachable_A_B=T, in_sun 王 FE，work_done 王 F， 
energy 一 80} ,目标 集 G={work_done 二 TT}。 

巡视 器 的 行为 建 模 如 下 。 


从 A 到 B 的 移动 动作 建 模 为 : movenp 二 二 10,C。， EE,, 条 件 集 C= 二 {过 (st,， 
stn) at_A=T>, <(st,, stn) reachable_A_B=T>, <(st,, st») energy 之 一 
40 二 } ,效果 集 E, = 二 {二 (et,， etn) at_B 王 T>>， 之 (et,, etn) at_A=F>, <(et,, 
etw ) energy 一 一 30 >})。 

在 B 点 探测 的 动作 建 模 为 : works 王 一 dur.，C.， FE 二 ,条 件 集 C, 二 {二 (st,， 
stw) at_B=T>, <(st,, stw) energy >=30>, <(st,, stw) work_done= 
F 二 ) ,效果 集 E,= 二 {二 (et,, etw) energy 一 一 20 二 ,所 (et ，etw) work_done= 
和 > 本 


“定时 触发 文字 ” 集 TL 二 {二 [30] in_sun 二 TT) 表示 巡视 器 在 时 间 30 上 开始 有 光 
照 ,并 且 一 直 持 续 处 于 光照 范围 ,在 时 间 30 之 前 无 光照 。 

面 对 形 如 定义 9. 1 的 时 态 规划 问题 ,如 何 求解 呢 ? 我 们 简要 介绍 时 态 规划 系统 
SAPA[1 Do M B,2011] 的 规划 方法 。SAPA 通过 在 状态 空间 上 进行 启发 式 搜索 的 技术 
实现 规划 。 空 间 中 的 状态 结 点 s 的 形式 为 (P;M;IT; Q; 2)。 


为 状态 的 发 生 时 刻 , 称 为 的“ 时间 戳 ”(time stamp)。 

忆 王 (去 记 , 人 1 去 引 记 录 命 题 p; 在 1 之 前 的 最 近 一 次 的 成 立时 刻 , 即 p; 在 [1;， 
韦 上 一 直 成 立 。 

M 记录 数值 变量 和 函数 的 取 值 。 

区 为 需要 保持 成 立 的 命题 集 , 其 中 的 命题 为 某 动作 前 提 中 的 持续 型 前 提 。 

Q 是 “事件 " 集 ,定义 了 从 s 开始 将 发 生 的 事件 。 一 个 事件 e 可 对 s 做 如 下 3 种 更 
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新 : 改变 PP 中 某 谓词 的 真 值 ; @ 改 变 M 中 某 数值 变量 的 取 值 ; 四 结束 某 个 命 
题 的 持续 ,即使 该 命题 在 e 发 生 后 不 再 成 立 。 

给 定 一 个 状态 ;,SAPA 的 搜索 算法 可 通过 两 种 途径 扩展 * 的 子 结 点 (状态 ): 四 应 用 
一 个 在 s 上 可 执行 的 动作 ; @ 触 发 ;中 时 间 最 近 的 一 个 事件 。 在 搜索 策略 上 ,SAPA 对 下 
一 个 结 点 的 扩展 选择 受 启发 函数 的 引导 ,该 函数 利用 “时 态 规 划 图 ”(temporal planning 
graph) 中 估计 每 个 结 点 的 目标 距离 [1 Do M B,2011]。 

在 类 似 的 状态 空间 上 ,启发 函数 的 设计 对 求解 效率 也 有 影响 。 例 如 ,Eyerich 等 在 时 
态 规划 系统 (Temporal Fast Downward，TFD) 上 设计 的 基于 因果 图 (causal graph) 分 析 
的 启发 函数 中, 经 实验 表明 能 产生 更 合理 的 目标 距离 估计 。 

SAPA 和 TFD 两 个 规划 系统 在 动作 应 用 时 就 将 动作 的 开始 时 刻 确定 化 ,而 规划 系统 
POPF 中 针对 动作 开始 时 刻 的 确定 采用 了 不 同 的 策略 。POPF 在 动作 应 用 时 不 指定 该 动 
作 的 开始 时 刻 , 而 是 通过 维护 一 个 时 态 约 束 集 并 检测 该 集合 的 相 容 性 保证 动作 序列 的 有 
效 性 。POPF 对 动作 开始 时 刻 的 处 理 类 似 于 早期 规划 方法 中 的 “延迟 承诺 ” (least 
commitment) 思 想 ,在 处 理 存在 动作 并 行 要 求 的 某 些 时 态 规划 问题 上 具有 方法 优势 。 关 
于 时 态 规划 的 模型 扩展 和 求解 方法 研究 的 成 果 , 可 参阅 智能 规划 领域 学 术 会 议 
(International Conference on Automated Planning and Scheduling, ICAPS) 的 历届 论 
文集 。 


9.8 多 Agent 规划 


到 目前 为 止 ,我 们 已 经 处 理 了 单 Agent 环境 ,在 其 中 我 们 的 Agent 是 独处 的 。 当 环 
境 中 有 其 他 Agent 时 ,我们 的 Agent 能 够 简单 地 将 它们 包含 在 它 的 环境 模型 中 ,而 不 必 
改变 它 的 基本 算法 。 然 而 ,在 很 多 情况 下 ,这 将 导致 较 差 的 性 能 ,因为 对 付 其 他 Agent 与 
对 付 自然 环境 是 不 一 样 的 。 特 别 地 ,自然 环境 (人 们 假设 ) 对 Agent 的 意图 不 感 兴趣 , 然 
而 ,其 他 Agent 不 是 这 样 的。 本 节 引 入 多 Agent 规划 来 处 理 这 些 情况 。 

多 Agent 环境 可 以 是 合作 的 或 者 竞争 的 。 我 们 从 一 个 简单 的 合作 例子 开始 : 网 球 双 
打 的 团队 规划 。 可 以 构造 指定 团队 内 每 个 队员 动作 的 规划 ;我 们 将 描述 有 效 地 构造 这 类 
规划 的 技术 。 有 效 的 规划 构造 是 有 用 的 ,但 是 并 不 保证 成 功 : Agent 不 得 不 同意 使 用 同 
样 的 规划 。 这 需要 某 种 形式 的 协调 ,可 能 通过 通信 获得 。 

1. 合作 : 联合 目标 和 规划 

参加 一 个 网 球 双 打 团队 的 两 个 Agent 有 赢得 比赛 的 联合 目标 ,这 带 来 各 种 子 目标 。 
假设 在 游戏 中 的 某 一 点 ,它们 有 联合 目标 ,将 击 给 它们 的 球 打 回去 并 确保 它们 中 至 少 有 一 
个 防守 网 前 。 我 们 可 以 把 这 个 观念 表示 为 一 个 多 Agent 规划 问题 ,具体 描述 如 下 。 

Agents (A.B) 
Init (At (A, [Left, Baseline ]) NM Ari(B, [Right, net ]) 
A Approaching (Ball, [Right, Baseline])) 
人 Partiner (A.B) 人 Pariner (B.A) 
Goal (Returned (Ball) M At(agent, [x, Net])) 
Action (Hit (agent, Ball) 
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PRECOND: Approaching (Ball, [x,y]) A At(agent, [x,y]) A 
Partner (agent, partner) 人 At(pariner, [zx,y]), 
EFFECT: Returned (Ball)) 
Action (Go (agent ,[x,y]), 
PRECOND: Ar(agent ,[a.b]), 
EFFECT: Ar (ageni ,[z,y]) A At(agent, [a,b])) 

这 种 符号 表示 引入 了 两 个 新 特征 : 第 一 ,Ageni(A,B) 声 明 有 两 个 Agent: A 和 B, 它 
们 参与 规划 。( 对 于 这 个 问题 ,对 手 不 是 被 考虑 的 Agent); 第 二 ,每 个 动作 明确 地 将 
Agent 作为 一 个 参数 ,因为 我 们 需要 记录 是 哪个 Agent 完成 的 。 

多 Agent 规划 问题 的 一 个 解 是 由 每 个 Agent 的 动作 组 成 的 联合 规划 。 如 果 当 每 个 
Agent 都 执行 它 分 配 到 的 动作 时 目标 能 够 实现 ,那么 这 个 联合 规划 是 一 个 解 。 下 面 的 规 
划 是 网 球 问题 的 一 个 解 。 

PLAN 1: 

A: [Go(A,[Right, Baseline]), Hit(A, Ball)] 
B: [NoOp(B),NoOp(B)] 

如 果 两 个 Agent 有 相同 的 知识 库 ,并 且 如 果 这 是 唯一 的 解 ,那么 每 件 事 都 很 好 : 
Agent 能 够 各 自决 定 解 , 然 后 联合 执行 它 。 对 于 Agent 不 幸 的 是 (我 们 很 快 会 看 到 为 什么 
是 不 幸 的 ) ,还 有 另 一 个 和 第 一 个 规划 同样 满足 目标 的 规划 : 

PLAN2: 

A: [Go(A, [Left, Net]), NoOp(A)] 
B: [Go(B, [Right, Baseline]), Hii(B, Ball)] 

如 果 A 选择 规划 2,B 选择 规划 1, 那么 没有 人 会 把 球 打 回 去 。 相 反 , 如 果 A 选择 1， 
B 选择 2, 那 么 它们 可 能 互相 碰撞 ,仍然 没有 人 把 球 打 回 去 ,网 前 也 会 保持 无 保护 状态 。 
因此 ,存在 正确 的 联合 规划 并 不 意味 着 目标 会 实现 。Agent 需要 一 个 协调 的 机 制 来 达到 
相同 的 联合 规划 。 此 外 , 某 个 特定 的 联合 规划 将 被 执行 ,在 Agent 中 这 应 该 是 常识 。 

2. 多 Agent 规划 

本 节 集 中 在 正确 联合 规划 的 构建 上 ,我 们 称 之 为 多 Agent 规划 , 它 本 质 上 是 面 对 单 
个 集中 Agent 的 规划 问题 , 它 能 够 指示 几 个 物理 实体 中 每 一 个 实体 的 动作 。 在 真正 的 多 
Agent 情况 下 , 它 使 得 每 个 Agent 能 够 计算 出 如 果 联 合 执行 将 会 成 功 的 可 能 联合 规划 是 
什么 。 

我 们 进行 多 Agent 规划 的 方法 是 基于 偏 序 规划 的 ,假设 环境 是 完全 可 观察 的 ,以 保 
持 事物 的 简单 性 。 有 一 个 不 会 在 单 Agent 情况 下 出 现 的 附加 情况 : 环境 不 再 是 真正 静态 
的 ,因为 当 任何 特定 的 Agent 正在 深思 时 ,其 他 Agent 可 能 动作 。 因 此 ,我 们 需要 关注 同 
步 。 为 了 简单 起 见 ,我 们 假设 每 个 动作 需要 花费 等 量 的 时 间 ,而 且 联 合 规划 中 每 一 点 的 动 
作 是 同时 发 生 的 。 

在 时 间 的 任何 一 点 ,每 个 Agent 刚好 执行 一 个 动作 (可 能 包含 NoOp) ,同时 发 生 的 动 
作 集 被 称 为 联合 动作 。 例 如 ,具有 两 个 Agent A 和 B 的 网 球 域 的 一 个 联合 动作 是 
去 NoOp(A) ,HiCB，Bal0) 之 。 一 个 联合 规划 由 联合 动作 的 偏 序 图 组 成 。 例 如 ,网 球 问 
题 的 PLAN2 可 以 表示 为 这 个 联合 动作 序列 : 
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<Go(A, (Left, Net)), Go(B, (Right, Baseline))> 
=NoOp(A), Hii(B, Ball)> 
我 们 能 够 用 常规 的 POP 算法 进行 规划 ,应 用 于 所 有 可 能 联合 动作 的 集合 。 唯 一 的 问 
题 是 这 个 集合 的 大 小 : 有 10 个 动作 和 5 个 Agent, 我 们 得 到 105 个 联合 动作 。 正 确 指定 
每 个 动作 的 前 提 和 效果 是 乏味 的 ,而 且 用 如 此 大 的 一 个 集合 进行 规划 是 无 效率 的 。 
一 个 替代 方法 是 通过 描述 每 个 单独 的 动作 如 何 与 其 他 可 能 动作 互相 影响 来 隐 含 地 定 
义 联合 动作 。 这 会 变 得 简单 ,因为 大 部 分 动作 独立 于 大 部 分 其 他 动作 ;我 们 只 需要 列 出 少 
数 几 个 真正 相互 作用 的 动作 。 我 们 可 以 扩充 通常 的 STRIPS 或 ADL 动作 描述 做 到 , 通 
过 使 用 一 个 新 特征 : 并 发 动作 表 。 这 与 动作 描述 的 前 提 相 似 ,除了 不 再 描述 状态 变量 外 ， 
它 描述 的 动作 一 定 是 或 一 定 不 是 并 发 执行 的 。 例 如 ,Hiz 动作 可 以 被 描述 如 下 。 
Action( Hit(A, Ball), 
CONCURRENT: ~ Hi(B, Ball) 
PRECOND: Approaching(Ball,[xz,y]))AAiA, [zx,y]) 
EFFECT: Returned( Ball) 
这 里 ,我们 得 到 了 禁止 并 发 性 约束 ,在 执行 Hi 动作 期 间 不 能 有 另 一 个 Agent 的 其 他 Hit 
动作 。 我 们 也 可 以 要 求 并 发 动作 ,例如 , 当 需 要 两 个 Agent 运送 装 满 饮料 的 冷却 器 到 网 
球场 时 ,这 个 动作 的 描述 说 明 Agent A 不 能 执行 一 个 Carry (和 运送) 动作 ,除非 另 一 个 
Agent B 正在 同时 执行 对 同一 个 冷却 器 的 Carry 动作 。 
Action(Carry(A, cooler, here, there), 
CONCURRENT: Carry(B, cooler, here, there) 
PRECOND: Ar(A, there) MAi(cooler, there) 人 Cooler(cooler) 
EFFECT: At(A, there) MN At(cooler, there) \ " Ai(A, here) N\ At(cooler, here) 
用 这 种 表示 创建 一 个 非常 接近 POP 偏 序 规划 器 的 规划 器 是 可 能 的 。 有 3 点 不 同 : 
(1) 除 时 序 关系 A<B 外 ,允许 A=B 和 AB, 分 别 意味 着 “并 发 的 "和 "之 前 或 并 发 ”。 
(2) 当 一 个 新 动作 需要 并 发 动作 时 ,必须 用 规划 中 新 的 或 已 经 存在 的 动作 实例 化 那 


些 并 发 动作 。 

(3) 禁止 并 发 动作 是 一 个 约束 的 附加 来 源 。 每 个 约束 必须 通过 对 冲突 动作 的 前 后 顺 
序 加 以 约束 来 解决 。 

3. 协调 机 制 


一 组 Agent 能 够 确保 在 一 个 联合 规划 上 取得 一 致 的 最 简单 方法 是 在 参加 联合 动作 
之 前 采用 公约 。 公 约 是 在 对 联合 规划 的 选择 之 上 的 任何 约束 ,超过 “如 果 所 有 Agent 都 
采用 , 则 联合 规划 必须 运转 ”的 基本 约束 。 例 如 ,公约 “坚守 球场 上 你 的 那 一 侧 ” 会 引起 双 
打 伙 伴 选 择 规划 2, 而 公约 “一 个 参赛 者 总 是 待 在 网 前 ”会 导致 它们 选择 规划 1。 一 些 公 约 
(如 在 道路 的 某 一 侧 驾 驶 ) 是 如 此 广泛 地 被 采用 以 致 它们 被 认为 是 社会 法 律 。 人 类 的 语言 
也 可 以 被 视 为 公约 。 

上 述 公约 是 依赖 于 特定 领域 的 ,并 且 能 通过 对 行为 描述 进行 约束 ,以 排除 违反 公约 的 
情况 实现 。 一 个 更 加 一 般 的 方法 是 使 用 领域 无 关 的 公约 。 例 如 ,如 果 每 个 Agent 运行 具 
有 相同 输入 的 同一 个 多 Agent 规划 算法 , 它 能 遵循 “执行 第 一 个 找到 的 可 行 联合 规划 ?的 
公约 ,确信 其 他 Agent 也 会 做 出 相同 的 选择 。 一 个 更 鲁 棒 但 是 更 昂贵 的 策略 是 产生 所 有 
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的 联合 规划 ,然后 从 中 挑选 一 个 满足 预先 约定 策略 的 联合 规划 。 

公约 也 会 通过 进化 的 过 程 出 现 。 例 如 ,群居 昆虫 群体 执行 非常 精细 的 联合 规划 ,这 被 
群体 内 个 体 的 共同 基因 构造 所 推动 。 一 致 性 也 能 通过 公约 的 偏差 会 减少 进化 适应 性 的 事 
实 而 被 增强 ,所 以 任何 可 行 的 联合 规划 都 能 够 变 成 稳定 的 均衡 。 将 相似 的 考虑 应 用 到 人 
类 语言 的 发 展 上 ,其 中 重要 的 事情 不 是 每 个 个 体 该 说 哪 种 语言 ,而 是 所 有 个 体 说 同一 种 语 
言 的 事实 。 例 如 ,如 果 每 个 鸟 类 Agent( 有 时 称 为 机 器 鸟 ,或 写 为 bird) 用 某 种 组 合 方法 执 
行 下 面 的 3 条 规则 ,就 能 够 得 到 鸟 类 群居 行为 的 一 个 合理 的 模拟 。 

(1) 分 离 性 : 当 与 邻居 距离 太 近 时 , 飞 离 邻居 。 

(2) 凝聚 性 : 飞 向 邻居 的 平均 位 置 。 

(3) 列队 性 : 飞 向 邻居 的 平均 方向 (朝向 ) 。 

如 果 所 有 的 鸟 执行 相同 的 策略 , 鸟 群 展示 出 飞行 的 涌现 行为 ,如 同一 个 不 会 随时 间 散 
开 的 具有 大 致 常数 密度 的 伪 刚 体 。 如 同 昆 虫 , 不 需要 每 个 Agent 都 拥有 以 其 他 Agent 的 
动作 为 模型 的 联合 规划 。 

典型 地 ,公约 被 用 来 覆盖 个 体 多 Agent 规划 问题 的 全 域 ,而 不 是 对 每 个 问题 重新 开 
发 。 这 能 导致 不 灵活 性 和 崩溃 ,如 同 有 时 在 网 球 双打 中 当 球 在 两 个 伙伴 之 间 大 致 等 距离 
时 所 看 到 的 。 在 缺乏 可 应 用 的 公约 时 ,Agent 可 以 使 用 通信 获得 一 个 可 行 联合 规划 的 常 
识 。 例 如 ,一 个 网 球 双打 比赛 者 可 能 喊 “ 我 的 1 或 “你 的 1”, 以 指示 一 个 偏好 的 联合 规划 。 
但 我 们 观察 到 涉及 口头 交换 的 通信 不 是 必要 的 。 例 如 ,一 个 比赛 者 可 以 简单 地 通过 执行 
规划 的 第 一 部 分 对 另 一 个 同伴 传达 一 个 偏好 联合 规划 。 在 我 们 的 网 球 问题 中 ,如 果 
Agent A 去 网 前 ,那么 Agent B 不 得 不 后 退 到 底线 来 击 球 , 因 为 规划 2 是 唯一 的 以 A 去 
网 前 开始 的 联合 规划 。 这 个 协调 的 方法 有 时 称 为 规划 识别 ,在 一 个 单个 动作 (或 短 的 动作 
序列 ) 足 以 无 歧义 地 确定 一 个 联合 规划 时 是 可 行 的 。 

确保 Agent 达到 一 个 成 功 的 联合 规划 的 负担 可 以 放 在 Agent 设计 者 或 Agent 自身 
上 。 在 前 一 种 情况 下 ,在 Agent 开始 规划 前 ,Agent 设计 者 应 该 证 明 Agent 的 策略 和 战 
略 将 会 成 功 。 如 果 Agent 适合 于 它们 所 在 的 环境 ,并 且 不 需要 关于 其 他 Agent 的 明确 模 
型 , 则 Agent 自身 可 以 是 反应 式 的 。 在 后 一 种 情况 下 , Agent 是 慎重 的 ,考虑 到 其 他 
Agent 的 推理 ,它们 必须 证 明 或 者 示范 自己 的 规划 是 有 效 的 。 例 如 ,在 一 个 具有 两 个 多 辑 
Agent A 和 B 的 环境 中 ,它们 两 个 都 有 如 下 的 定义 。 

Vp,s Feasible(p,s)SCommonKnowledge([A.B],.Achieves(p,s,Goal)) 
这 说 明 在 任何 情景 * 中 ,如 果 *“p 将 获得 目标 ”在 Agent 之 中 是 共识 ,规划 p 是 在 那个 情景 
中 可 行 的 联合 规划 。 需 要 更 进一步 的 公理 建立 联合 意图 的 共识 ,以 执行 一 个 特殊 联合 规 
划 。 只 有 那 时 Agent 才能 开始 动作 。 

4. 竞争 

并 不 是 所 有 的 多 Agent 环境 只 涉及 合作 Agent。 具 有 相互 冲突 的 效用 函数 的 Agent 
是 彼此 竞争 的 。 这 样 的 一 个 例子 是 两 人 零 和 游戏 ,如 国际 象棋 。 一 个 下 国际 象棋 的 
Agent 需要 考虑 对 手 未 来 几 步 的 可 能 移动 。 也 就 是 说 ,一 个 Agent 在 竞争 的 环境 中 必须 
@ 认 识 到 有 其 他 Agent; @ 计 算 另 一 个 Agent 的 一 些 可 能 规划 ; @ 计 算 其 他 Agent 的 规 
划 是 如 何 与 它 自己 的 规划 相互 影响 的 ; @ 从 这 些 相 互 影 响 的 角度 考虑 ,决定 最 好 的 动作 。 
所 以 ,竞争 如 同 合作 ,需要 关于 其 他 Agent 的 规划 的 模型 。 另 外 ,在 竞争 环境 中 没有 联合 
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规划 的 承诺 。 


9.9 案例 分 析 


9.9.1 规划 问题 的 建 模 与 规划 系统 的 求解 过 程 


使 用 PDDL 对 某 个 领域 的 规划 问题 进行 建 模 ,包括 “操作 建 模 ”( 领 域 建 模 ) 和 “任务 
建 模 ” 两 部 分 。 请 根据 PDDL 的 语法 ,理解 Tyreworld 领域 的 领域 建 模 结果 和 任务 建 模 
结果 ,并 使 用 智能 规划 系统 软件 FastForward( 简 称 FF) 完 成 求解 ,分 析 比 较 人 类 手工 进 
行规 划 和 使 用 FF 进行 规划 的 优势 与 劣势 。 

资源 说 明 : 从 麻 省 理工 学 院 的 教学 网 页 (http://www. ai. mit. edu/courses/16. 
412J/f. html) 下 载 Tyreworld (“ 机 器 人 换 轮 胎 问题 "的 PDDL 建 模 文件 : 领域 建 模 文件 
tyreworld_domain. pddl (链接 http://www. ai. mit. edu/courses/16. 412J/tyreworld _ 
domain. pddl) ,一 个 具体 任务 的 建 模 文件 tyreworld_factsl. pddl( 链 接 http://www. ai. 
mit, edu/courses/16. 412J/tyreworld_factsl ,将 文本 内 容 保存 为 tyreworld_facts1. pddl) 。 

操作 说 明 : 在 Linux 操作 系统 上 编译 智能 规划 系统 FF( 源 代码 链接 https://fai. cs. 
uni-saarland. de/hoffmann/ff/FF-v2. 3. tgz) ,按照 网 页 的 说 明 进 行 编译 。 编 译 成 功 后 ,使 
用 命令 行 . /ff -o tyreworld_domain. pddl -f tyreworld_factsl. pddl 求解 “机 器 人 换 轮 胎 ” 
领域 的 具体 任务 tyreworld_factsl ,阅读 并 分 析 FF 给 出 的 规划 解 中 的 每 个 动作 ,并 验证 
机 器 人 能 否 按照 该 规划 实现 目标 。 

编译 规划 系统 FF 的 源 代码 需要 在 Linux 下 进行 ,可 以 采用 Ubuntu 版 本 的 Linux。 
FF 源 代码 的 编译 需要 Bison 和 Lex 这 两 个 语法 分 析 软 件 和 Make 软件 ,请 先 确 认 系 统 是 
否 安 装 了 这 些 软件 。 编 译 错误 主要 源 自 Bison 的 版 本 升级 问题 ,参照 网 页 https:/ /fai. 
cs. uni-saarland. de/hoffmann/ff. html 了 解 详细 的 说 明 。 

运行 FF 的 时 候 需 要 进入 FF 所 在 的 目录 ,其 可 行文 件 的 名 称 为 ff, 需 要 两 个 参数 : 
第 一 个 参数 为 领域 定义 文件 的 路 径 , 附 在 -o 选项 标记 之 后 ;第 二 个 参数 为 问题 实例 文件 
的 路 径 , 附 在 -f 选 项 之 后 。 

输出 结果 如 下 。 


./ff -o tyer world.pddl ~ £ tyreworld factsl.pddl 

ff: parsing domain file 

domain 'TYREWORLD' defined 

.. done. 

ff: parsing problem file 

Problem 'TIREWORLD- 1' defined 

». done. 

Cueing down from goal distance: 3 into depth [1] 

[1] 
[1] 


口 FF 
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Cueing down from goal distance: 8 into depth [1] 


时 


吕 hhnbuwwmou an 


Cueing down from goal distance: 。 5 into depth [1] 


4 


or 


Cueing down from goal distance: 1 into depth [1] 


0 


Cueing down from goal distance: 1 into depth [1] 


0 


Cueing down from goal distance: 1 into depth [1] 


ff: found legal Plan as follows 
step 0: OPEN BOOT 
1: FETCH PUMP BOOT 
2: INFLATE R1 
FETCH JACK BOOT 
4: FETCH WRENCH BOOT 


5: LOOSEN NUTS1 THE- HUB1 

6: FETCH R1 BOOT 

7: JACK- UP THE- HUB1 

8: UNDO NUTS1 THE- HUB1 

9: REMOVE- WHEEL Wl] THE- HUB1 


10: PUT- ON- WHEEL R1 THE- HUB1 


11: PUT- AWAY Wl1 BOOT 

12: PUT- AWAY PUMP BOOT 

13: DO- UP NUTS1 THE- HUB1 
14: JACK— DOWN THE- HUB1 
15: TIGHTEN NUTS1 THE-— HUB1 
16: PUT- AWAY JACK BOOT 
17: PUT- AWAY WRENCH BOOT 


0 


[1] 
[1] 
[1] 
[1] 
[1] 
[1] 
[1] 


[1] 
[1] 
[1] 
[1] 
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18: CLOSE BOOT 
time spent: 0.00 seconds instantiating 25 easy, 0 hard action templates 
0.00 seconds reachability analysis, yielding 25 facts and 25 actions 
0.00 seconds creating final representation with 25 relevant facts 
0.00 seconds building connectivity graph 
0.00 seconds searching, evaluating 28 states, to a max depth of 1 
0.00 seconds total time 


其 中 ,“ff: found legal plan as follows” 下 面 的 为 规划 解 , 这 个 解 一 共 包 含 19 个 动作 ,编号 为 
0 一 18, 根 据 每 个 动作 对 应 的 操作 和 参数 实例 ,从 初始 状态 逐个 按 序 应 用 这 些 动作 ,逐个 计算 
动作 应 用 后 的 状态 ,判断 最 后 得 到 的 状态 是 否 满足 目标 条 件 。 “time spent: "之 后 的 输出 部 
分 显示 了 FF 规划 器 求解 此 实例 时 各 功能 组 件 所 消耗 的 时 间 情 况 和 总 共 的 求解 时 间 。 


9.9.2 Shakey 世界 


最 初 的 STRIPS 程序 是 设计 用 来 控制 机 器 人 Shakey 的 。 图 9-3 显示 了 一 个 版 本 的 
由 4 个 沿 走廊 排列 的 房间 组 成 的 Shakey 世界 ,其 中 每 个 房间 有 一 扇 门 和 一 个 电灯 开关 ， 
房间 1 和 4 的 灯 开 着 ,房间 2 和 3 的 灯 关 了 。Shakey 能 够 在 一 个 房间 内 的 地 标 间 移动 ， 
能 够 穿 过 房间 之 间 的 门 ,能 够 仆 上 可 疏 的 对 象 , 也 能 够 推 可 推 的 对 象 ,并 且 能 按 电灯 开关 。 
Shakey 世界 中 的 动作 包括 从 一 个 地 方 移动 到 另 一 个 地 方 , 推 可 移动 物体 (如 箱子 ), 息 上 
或 假 下 刚性 物体 (如 箱子 ) 及 打开 和 关上 电灯 开关 。 机 器 人 自身 不 够 智能 而 不 能 自主 息 上 
箱子 或 切换 开关 ,但 是 STRIPS 规划 器 能 够 形成 完成 一 定 任务 的 机 器 人 规划 。Shakey 的 
6 种 动作 如 下 。 








Switch 3 


ti 本 Door3 


Roo! 
Shakey 
Switeh 2 Sig 






































Door2 
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Switch | 
Eo Box2 
Door 1 
Room 1 
Box 4 Box1 























图 9-3 Shakey 世界 
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(1) Go(x, y, r) ,这 要 求 Shakey 位 于 zx 且 xz 和 yy 是 同一 房间 > 内 的 位 置 。 约 定 两 
个 房间 之 间 的 门 视 为 它们 内 部 的 。 
(2) 在 同一 房间 > 内 将 箱子 2 从 位 置 zx 推 到 位 置 y: Push(0, zx，y, ~) 。 用 到 箱子 常量 。 
(3) 从 位 置 工 和 候 上 一 个 箱子 : ClimbUp(z, 5)。 
(4) 从 一 个 箱子 上 疏 下 : ClimbDown(b, z) 。 需 要 谓词 On 和 常量 Floor。 
(5) 开 电 灯 开 关 : TurnOn(s, 5)。 
(6) 关 电 灯 开 关 : TurnOff(s, 5)。 要 打开 或 关闭 电灯 开关 ,Shakey 必须 在 电灯 开关 
位 置 的 一 个 箱子 上 。 
写 出 Shakey 的 6 种 动作 的 PDDL 语句 及 图 9-3 的 初始 状态 。 构 建 一 个 让 Shakey 把 Box 
2 带 到 Room 2 里 的 规划 。 
解 : 用 PDDL 描述 的 操作 模型 如 下 。 
Action (Go(x, yr), PRECOND: At(Shakey, x) MIn(x, r)AIn(y, r), 
EFFECT: At(Shakey, y) A\ -~ At(Shakey, x)) 
Action (Push(b, x, y,r), PRECOND: At(Shakey, x) 人 Pushable(b) AInCx，r) 人 
In(y, r), 
EFFECT: At(b, y) AAt(Shakey, y) A -~ At(b, x)A -~ At(Shakey, x)) 
Action (ClimbUp(b), PRECOND: At(Shakey, x)M At(b, x) A Climbable(b), 
EFFECT: On(Shakey, b)AM ~- On(Shakey, Floor)) 
Action (ClimbDown(b), PRECOND: On(Shakey, b). 
EFFECT: On(Shakey, Floor) \ ~ On(Shakey, b)) 
Action (TurnOn(l), PRECOND: On(Shakey, b) 人 A At(Shakey, x) A At(l, x), 
EFFECT: TurnedOn(l)) 
Action (TurnOff(1), PRECOND: On(Shakey, b) 人 At(Shakey, x)A At(l, x), 
EFFECT: ”TurnedOn(D ) 
图 9-3 的 初始 状态 描述 为 
In(Switch1,Rooml) AIn(Doorl,.Rooml) AIn(Doorl,Corridor) 
In(Switchl1 ,Room2) M In(Door2, Room2) AIn(Door2,Corridor) 
In(Switchl ,Room3) 人 AIn(Door3 ,Room3) 人 AIn(Door3 ,Corridor) 
In(Switchl1,Room4) M In(Door4,Room4) 人 In(Door4,Corridor) 
In(Shakey, Room3) 人 A At(Shakey. XS) 
In(Boxl,Rooml) 人 In(Box2,.Rooml)A 人 In(Box3.Rooml)A 人 In(Box4,Rooml) 
Climbable(Boxl) A Climbable(Box2) 人 A Climbable(Box3) 人 AClimbable(Box4) 
Pushable(Boxl) 人 Pushable(Box2) 人 Pushable(Box3) 人 APushable(Box4) 
At(Boxl,.Xi) A At(Box2.Xs*)AAt(Box3.Xs)AAt(Box4,X4) 
TurnedOn(Switchl) ATurnedOn(CSwitch4) 
Shakey 把 Box 2 带 到 Room 2 里 的 规划 为 
Go(CXS,Door3 ,Room3) 
Go(Door3 ,Doorl .Corridor) 
Go(CDoorl ,X Rooml) 
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Push(Box2,X; ,Doorl，Rooml) 
Push(Box2,Door] ,Door2,Corridor) 
Push(Box2,Door2, Switch2, Room2) 


9.10 小 结 


规划 既是 人 工 智能 特定 的 研究 领域 ,也 是 人 工 智能 要 实现 的 典型 任务 之 一 。 因 此 , 规 
划 既 有 其 自身 的 描述 语言 ,又 与 其 他 智能 技术 有 着 充分 的 结合 。 本 章 从 规划 问题 的 描述 
语言 与 实例 出 发 ,将 搜索 、 确 定性 推理 .不 确定 性 推理 和 Agent 等 技术 应 用 到 规划 中 , 结 
合 一 些 实例 进行 了 介绍 。 

无 人 机 航路 规划 是 一 种 典型 的 军事 应 用 场景 。 实 施 航路 规划 就 是 要 综合 多 类 相关 信 
息 ,考虑 无 人 机 性 能 、 到 达 时 间 油耗 ,威胁 及 飞行 区 域 等 约束 条 件 ,为 无 人 机 规划 出 一 条 
或 多 条 从 起 始点 到 目标 点 的 最 优 或 满意 的 航路 ,保证 无 人 机 圆满 完成 飞行 任务 并 安全 返 
回 基地 。 在 防空 技术 日 益 先 进 、 防 空 体系 日 益 完 善 的 现代 战争 中 ,航路 规划 是 提高 无 人 机 
作战 效能 ,实施 远程 精确 打击 的 有 效 手段 。 在 作战 环境 下 ,要 求 无 人 机 在 无 人 控制 的 条 件 
下 能 够 避 开 各 种 威胁 ,顺利 到 达 目 的 地 并 完成 指定 任务 ,这 就 对 航路 规划 技术 提出 了 很 高 
的 要 求 。 

在 大 规模 对 抗 任务 中 ,为 了 使 摧毁 目标 的 概率 最 大 ,需要 多 个 无 人 机 之 间 相互 配合 完 
成 打击 任务 ,这 就 涉及 多 机 协同 航路 规划 技术 。 多 机 协同 航路 规划 是 为 了 确立 每 一 个 无 
人 机 的 飞行 路 线 , 防 止 空中 碰撞 事故 ,并 在 尽 可 能 少 的 时 间 内 以 最 少 整体 代价 函数 到 达 目 
标 。 在 无 人 机 协同 航路 规划 中 ,到 达 目 标的 时 间 是 一 个 非常 重要 的 评估 指标 。 为 了 使 无 
人 机 能 够 同时 到 达 目 标 , 一 般 采用 以 下 两 种 方式 : 一 种 是 通过 协调 无 人 机 的 飞行 速度 使 
到 达 目 标 较 短 路 径 的 无 人 机 采取 小 的 速度 ,使 较 长 路 径 的 无 人 机 速度 加 大 ; 另 一 种 是 对 航 
路 做 一 些 修正 ,通过 附加 一 些 路 径 使 每 架 无 人 机 到 达 目 标点 的 距离 大 致 相等 。 在 多 机 协 
同 航路 规划 问题 中 ,求解 无 人 机 整体 最 优 航路 是 一 个 大 系统 的 非 线性 最 优化 问题 ,计算 复 
杂 , 对 信息 快速 处 理 要求 苛 刻 。 


习题 


9.1 猴子 和 香蕉 问题 。 实 验 室 的 一 只 猴子 面 对 天 花 板 上 的 一 些 够 不 到 的 香花 。 一 个 箱 
子 是 可 用 的 ,如 果 猴 子 候 上 箱子 , 它 就 可 以 够 到 香 巷 。 起 初 .猴子 位 于 A ,香蕉 位 于 
也 ,而 箱子 位 于 C。 猴 子 和 箱子 的 高 度 是 Low, 但 是 如 果 猴 子 疏 到 箱子 上 面 , 它 的 高 
度 就 跟 香 蕉 一 样 是 High。 猴 子 可 用 的 行动 包括 从 一 个 位 置 走 到 另 一 个 位 置 Go ,将 
对 象 从 一 个 地 方 移动 到 另 一 个 地 方 的 Push. 息 上 一 个 对 象 的 ClimbUp 或 假 下 一 个 
对 象 的 ClimbDown, 抓 住 一 个 对 象 的 Grasp 或 放 开 一 个 对 象 的 UnGrasp。 如 果 猴 
子 和 某 对 象 在 同一 个 地 方 的 同一 高 度 ,行动 “ 抓 住 ” 导 致 持 有 该 对 象 。 
(1) 给 出 初始 状态 描述 。 
(2) 给 出 STRIPS 风格 的 6 种 操作 定义 。 
(3) 假设 猴子 想 在 摘 取 香花 后 把 箱子 移 回 最 初 位 置 思 弄 溜 号 去 喝 茶 的 科学 家 。 这 
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个 目标 能 被 STRIPS 类 型 的 系统 解决 吗 ? 
(4) 对 Push 的 规则 可 能 是 不 正确 的 ,因为 如 果 对 象 太 重 , 当 Push 算 子 应 用 的 时 候 ， 
它 的 位 置 将 保持 不 变 。 这 是 分 支 问题 或 限制 问题 的 一 个 实例 吗 ? 请 修改 问题 
的 描述 ,解决 重 物 的 问题 。 
(5) 思考 两 只 猴子 共同 完成 任务 的 描述 与 解决 方法 。 
阐述 基于 状态 空间 搜索 的 规划 方法 和 基于 分 层 任务 网 络 的 规划 方法 在 问题 建 模 过 
程 和 求解 过 程 中 的 主要 区 别 。 
假设 有 一 个 机 器 人 能 够 为 汽车 更 换 轮胎 和 为 轮胎 充气 。 更 换 轮胎 的 主要 过 程 为 : 
打开 工具 箱 , 取 出 千斤 项 ,用 千斤 项 将 轮胎 抬 起 。 从 工具 箱 中 取出 套 简 扳手 ,使 用 套 
简 扳手 松 开 汽车 轮 载 上 需要 更 换 的 轮胎 , 印 下 该 轮胎 。 从 工具 箱 中 取出 备 胎 ,一 般 
备 胎 的 充气 不 足 ,需要 在 备 胎 安装 到 轮 载 后 再 使 用 打气 简 为 它 充 足 气 。 使 用 
STRIPS 语言 对 该 问题 进行 描述 。 
关于 目标 是 否 可 分 解 的 问题 。 当 目标 中 包含 多 个 目标 条 件 时 ,目标 可 分 解 的 规划 问 
题 具 有 如 下 特点 : 规划 系统 可 以 为 这 些 目标 条 件 排序 ,按照 该 顺序 依次 为 每 个 目标 
条 件 进行 规划 ,后 一 个 目标 条 件 是 以 前 一 个 目标 条 件 的 规划 执行 结果 为 初始 状态 
的 ,并 且 , 后 一 个 目标 条 件 的 实现 不 会 破坏 前 一 个 目标 的 实现 。 当 目标 可 分 解 时 , 规 
划 问 题 的 求解 难度 会 大 幅 下 降 , 因 此 ,识别 出 目标 可 分 解 的 规划 问题 是 很 重要 的 。 
请 以 “积木 世界 ”(blocks world) 问 题 中 的 Sussman 异常 问题 为 例 , 分 析 积 木 世 界 的 
问题 是 否 具 有 可 分 解 性 。 
(思考 题 )PDDL(Planning Domain Definition Language) 是 智能 规划 研究 者 提出 的 
一 种 最 初 用 于 学 术 研 究 ,随后 应 用 到 金属 加 工 机 控制 .Web 服务 组 合 、 打 印 机 作业 
调度 .自然 语言 处 理 等 领域 的 重要 语言 。PDDL 以 面向 对 象 的 思想 .谓词 逮 辑 的 表 
示 方 法 和 操作 建 模 的 思路 建 模 一 个 规划 领域 。 规 划 领 域 的 模型 与 规划 领域 的 具体 
实例 分 为 两 个 文本 文件 描述 。 其 中 ,规划 领域 的 模型 文件 包含 建 模 所 需要 的 类 型 定 
义 、 常 量 定义 、 函 数 定义 .谓词 定义 、 操 作 定义 等 。 规 划 领 域 的 具体 实例 包含 具体 的 
对 象 及 其 类 型 .初始 状态 描述 和 目标 条 件 描 述 。PDDL 的 设计 思想 是 仅 建 模 客观 问 
题 , 不 向 规划 求解 系统 提供 任何 的 求解 建议 或 引导 。 阅 读 文献 并 讨论 。 
(思考 题 )“ 国 际 智 能 规划 系统 竞赛 "(International Planning Competition,IPC) 通 常 
每 两 年 举办 一 次 ,通过 大 量 的 规划 问题 测试 新 开发 的 规划 系统 的 性 能 。IPC 使 用 的 
PDDL 和 参加 IPC 的 规划 系统 通常 反映 了 智能 规划 研究 在 领域 建 模 和 理论 研究 上 
的 前 沿 方向 ,从 事 智 能 规划 研究 与 应 用 的 人 员 应 当 及 时 关注 这 项 赛事 。 请 分 析 参 加 
2014 年 IPC 竞赛 的 有 哪些 规划 系统 ,使 用 的 测试 问题 域 有 哪些 ,这 次 竞赛 包含 了 哪 
些 分 赛 。 
【提示 】IPC (International Planning Competition) 主 网 站 : ipc. icaps-conference. 
org,2014 年 IPC 主办 方 的 网 站 : https://helios. hud. ac. uk/scommv/IPC-14。 
IPC-14 竞赛 包含 了 Sequential Satisficing Track、Sequential Optimal Track、 
Sequential Satisficing Multi-core Track、Sequential Agile Track、Temporal 
Satisficing Track 这 5 项 分 赛 。 参 加 每 项 分 赛 的 规划 系统 列表 见 网 页 https:// 
helios. hud. ac. uk/scommv/IPC-14/planners_actual. html。 用 于 比赛 的 测试 问题 
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域 见 网 页 https://helios. hud. ac. uk/scommv/IPC-14/domains. html。 

(思考 题 ) 概述 基 于 概率 方法 的 不 确定 规划 方法 和 Probabilistic Planning Domain 
Definition Language (PPDDL) 建 模 问题 。 

【提示 了 阅读 姜 云 飞 教授 的 译 著 《 自 动 规划 : 理论 和 实践 ) 的 第 16 章 理解 基于 马尔 可 
夫 决策 过 程 的 概率 规划 算法 。 

PPDDL 的 描述 见 www. tempastic. org/papers/CMU-CS-04-167. pdf ,求解 概率 规 
划 问 题 的 规划 系统 见 ICAPS 的 IPC-14 竞赛 网 站 : https://cs. uwaterloo. ca/ 一 
mgrzes/IPPC_2014/ 。 
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第 1O0 章 


机 器 人 学 


10.1 概述 


1950 年 , 阿 西 葛 夫 (Issac Asimov) 在 他 的 小 说 (我 ,机 器 人 (I,Robot)) 中 
提出 了 著名 的 “机 器 人 三 守则 ”: 

(1) 机 器 人 必须 不 危害 人 类 ,也 不 允许 它 眼看 人 将 受害 而 袖手旁观 。 

(2) 机 器 人 必须 绝对 服从 于 人 类 ,除非 这 种 服从 有 害 于 人 类 。 

(3) 机 器 人 必须 保护 自身 不 受到 伤害 ,除非 为 了 保护 人 类 或 者 是 人 类 命 
令 它 做 出 牺牲 。 

这 三 条 守则 给 机 器 人 赋 以 新 的 伦理 性 ,并 使 机 器 人 概念 通俗 化 ,更 易于 
人 类 社会 所 接受 ,同时 也 成 为 机 器 人 学 术 界 开发 机 器 人 的 行为 准则 。 

1954 年 ,美国 人 乔治 ， 德 沃 尔 (George Devol) 设 计 开 发 了 第 一 台 可 编程 
序 的 工业 机 器 人 (1961 年 获得 美国 专利 )。1962 年 ,美国 万 能 自动 化 
(unimation) 公 司 的 第 一 台 机 器 人 Unimate 在 美国 通用 汽车 公司 投入 使 用 ， 
这 标志 着 第 一 代 机 器 人 的 诞生 。 

国际 上 关于 机 器 人 的 定义 有 许多 ,例如 : 

(1) 英国 简明 牛津 字典 : 机 器 人 是 “貌似 人 的 自动 机 ,具有 智力 的 顺从 于 
人 的 但 不 具有 人 格 的 机 器 ”。 这 一 定义 并 不 完全 正确 ,因为 还 不 存在 与 人 类 
相似 的 机 器 人 在 运行 。 这 是 一 种 理想 的 机 器 人 。 

(2) 美国 机 器 人 协会 (RIA): 机 器 人 是 “一 种 用 于 移动 各 种 材料 、 零 件 、 
工具 或 专用 装置 的 ,通过 可 编程 序 动作 执行 各 种 任务 的 ,并 具有 编程 能 力 的 
多 功能 操作 机 (manipulator)”。 尽 管 这 一 定义 较为 实用 ,但 并 不 全 面 。 这 里 
指 的 是 工业 机 器 人 。 

(3) 日 本 工业 机 器 人 协会 (JIRA) : 工业 机 器 人 是 “一 种 装备 有 记忆 装置 
和 末端 执行 器 的 ,能 够 转动 并 通过 自动 完成 各 种 移动 代 蔡 人 类 劳动 的 通用 机 
器 ”。 或 者 分 两 种 情况 定义 : 其 一 ,工业 机 器 人 是 “一 种 能 够 执行 与 人 的 上 肢 
( 手 和 臂 ) 类 似 动作 的 多 功能 机 器 ;其 二 ,智能 机 器 人 是 “一 种 具有 感觉 和 识 
别 能 力 , 并 能 够 控制 自身 行为 的 机 器 ”。 

(4) 美国 国家 标准 局 (NBS) : 机 器 人 是 “一 种 能 够 进行 编程 并 在 自动 控 
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制 下 执行 某 些 操作 和 移动 作业 任务 的 机 械 装置 *。 这 也 是 一 种 比较 广义 的 工业 机 器 人 的 


Es 

(5) 国际 标准 化 组 织 (ISO) :“ 机 器 人 是 一 种 自动 的 、 位 置 可 控 的 .具有 编程 能 力 的 多 
功能 操作 机 ,这 种 操作 机 具有 几 个 轴 , 能 够 借助 可 编程 序 操作 处 理 各 种 材料 .零件 .工具 和 
专用 装置 ,以 执行 各 种 任务 "。 显 然 , 这 一 定义 与 RIA 的 定义 相似 。 

随 着 机 器 人 技术 研究 的 深入 和 应 用 领域 的 迅速 拓展 ,很 多 科学 家 给 出 了 机 器 人 的 定 
义 , 例 如 : 

(1) 森 政 弘 与 合 田 周 平 在 1967 年 日 本 召开 的 第 一 届 机 器 人 学 术 会 议 上 提出 的 :“ 机 
器 人 是 一 种 具有 移动 性 .个体 性 、 智 能 性 、 通 用 性 、 半 机 械 半 人 人 性、 自动 性 、 奴 隶 性 7 个 特征 
的 柔性 机 器 ”"。 从 这 一 定义 出 发 , 森 政 弘 又 提出 了 用 自动 性 、 智 能 性 、 个 体 性 、 半 机 械 半 人 
性 ,作业 性 ,通用 性 、 信 息 性 、 柔 性 有 限 性 、 移 动 性 10 个 特性 表示 机 器 人 的 形象 。 

(2) 加 芯 一 郎 在 同一 次 会 议 上 提出 的 : 具有 如 下 3 个 条 件 的 机 器 称 为 机 器 人 。 第 一 ， 
具有 脑 、 手 、 脚 三 要 素 的 个 体 ;第 二 ,具有 非 接触 传感器 (用 眼 、 耳 接受 远方 信息 ) 和 接触 传 
感 器 ;第 三 ,具有 平衡 觉 和 固有 觉 的 传感器 。 该 定义 强调 了 机 器 人 应 当 仿 人 的 含义 , 即 它 
靠 手 进行 作业 , 靠 脚 实现 移动 ,由 脑 完 成 统一 指挥 的 作用 。 非 接触 传感器 和 接触 传感器 相 
当 于 人 的 五 官 ,使 机 器 人 能 够 识别 外 界 环境 ,而 平衡 觉 和 固有 觉 则 是 机 器 人 感知 本 身 状 态 
不 可 缺少 的 传感器 。 这 里 描述 的 不 是 工业 机 器 人 ,而 是 自主 机 器 人 。 

(3) 法 国 的 埃 斯 皮 奥 在 1988 年 提出 :“ 机 器 人 学 是 指 设 计 能 根据 传感器 信息 实现 预 
先 规划 好 的 作业 系统 ,并 以 此 系统 的 使 用 方法 作为 研究 对 象 ”。 

(4) 我 国 科学 家 对 机 器 人 的 定义 是 :“ 机 器 人 是 一 种 自动 化 的 机 器 ,所 不 同 的 是 ,这 
种 机 器 具备 一 些 与 人 或 生物 相似 的 智能 能 力 , 如 感知 能 力 、 规 划 能 力 、 动 作 能 力 和 协同 能 
力 , 是 一 种 具有 高 度 灵活 性 的 自动 化 机 器 ”。 

















10.1.1 机 器 人 的 分 类 


从 上 述 的 定义 中 可 以 看 到 ,不 同 国家 对 不 同类 型 的 机 器 人 有 不 同 的 认识 ,按照 控制 机 
器 人 输入 信息 的 方式 不 同 , 从 定义 上 对 机 器 人 可 以 进行 不 同 的 分 类 。 

1. 日 本 和 美国 机 器 人 学 会 分 类 

按照 JIRA 的 标准 ,可 将 机 器 人 进行 如 下 分 类 。 

(1) 人 工 操 作 装 置 一 一 由 操作 员 操 纵 的 多 自由 度 装置 。 

(2) 固定 顺序 机 器 人 一 一 按 预 定 的 不 变 方法 有 步骤 地 依次 执行 任务 的 设备 ,其 执行 
顺序 难以 修改 。 

(3) 可 变 顺 序 机 器 人 一 一 同 第 2 类 ,但 其 顺序 易于 修改 。 

(4) 示 教 再 现 (playback) 机 器 人 一 一 操作 员 引 导 机 器 人 手动 执行 任务 ,记录 下 这 些 
动作 并 由 机 器 人 以 后 再 现 执行 , 即 机 器 人 按照 记录 下 的 信息 重复 执行 同样 的 动作 。 

(5) 数控 机 器 人 一 一 操作 员 为 机 器 人 提供 运动 程序 ,而 不 是 手动 示 教 执行 任务 。 

(6) 智能 机 器 人 一 一 机 器 人 具有 感知 和 理解 外 部 环境 的 能 力 ,即使 其 工作 环境 发 生 
变化 ,也 能 够 成 功 地 完成 任务 。 

RIA 只 将 以 上 (3) 一 (6) 类 视 作 机 器 人 。 手 动 装置 (如 一 个 多 自由 度 的 需要 操作 员 驱 
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动 的 装置 ) 或 固定 顺序 机 器 人 (如 有 些 装 置 由 强制 起 停 控 制 驱动 器 控制 ,其 顺序 是 固定 的 
并 且 很 难 更 改 ) 都 不 认为 是 机 器 人 。 

2. 法 国 机 器 人 学 会 分 类 

法 国 机 器 人 学 会 (AFR) 将 机 器 人 进行 如 下 分 类 。 

类 型 A: 手动 控制 远程 机 器 人 的 操纵 装置 ,相当 于 JIRA 中 的 第 1 类。 

类 型 B: 具有 预定 周期 的 自动 操纵 装置 ,相当 于 JIRA 中 的 第 2 类 和 第 3 类 。 

类 型 C: 具有 连续 轨迹 或 点 到 点 轨迹 的 可 编程 伺服 控制 机 器 人 ,相当 于 JIRA 中 的 第 
4 类 和 第 5 类 。 

类 型 D: 同类 型 C, 但 能 够 获取 环境 信息 ,相当 于 JIRA 中 的 第 6 类 。 

此 外 ,根据 机 器 人 的 控制 方式 、 智 能 程度 、 实 际 用 途 都 可 以 对 机 器 人 进行 不 同方 式 的 
分 类 。 例 如 ,根据 控制 方式 ,分 为 非 伺服 机 器 人 和 伺服 机 器 人 ;根据 智能 程度 分 为 一 般 机 
器 人 和 智能 机 器 人 (智能 机 器 人 又 可 分 为 传 感 型 ,交互 型 和 自主 型 ) 。 





10.1.2 机 器 人 的 特性 


相对 于 传统 机 器 和 人 ,机 器 人 具有 许多 明显 的 特点 。 

一 方面 ,相对 于 传统 机 器 ,作为 自动 化 技术 之 一 ,机 器 人 在 多 数 情况 下 可 以 提高 生产 
率 、 安 全 性 ,效率 .产品 质量 和 产品 的 一 致 性 ,但 其 费用 开销 较 大 ,包括 原始 的 设备 费用 、 安 
装 费 用 ,需要 周边 设备 ,同时 有 培训 、 服 务 、 再 次 开发 等 费用 。 

另 一 方面 ,相对 于 人 类 ,机 器 人 可 以 在 危险 的 环境 下 工作 ,而 无 须 考虑 生命 保障 或 安 
全 的 需要 ;无 须 合适 的 环境 ,如 考虑 照明 空调 .通风 以 及 噪声 隔离 等 :能 不 知 疲倦 ,不知 厌 
烦 地 持续 工作 ,它们 不 会 有 心理 问题 ,做 事 不 拖 表 ,不 需要 医疗 保险 或 假期 。 除 了 发 生 故 
障 或 磨损 外 ,将 始终 如 一 地 保持 精确 度 。 机 器 人 和 其 附属 设备 及 传感器 具有 某 些 人 类 不 
具备 的 能 力 。 机 器 人 可 以 同时 响应 多 个 激励 或 处 理 多 项 任务 ,而 人 类 只 能 响应 一 个 现行 
激励 。 

但 是 ,机 器 人 缺乏 应 急 能 力 ,除非 该 紧急 情况 能 够 预知 并 已 在 系统 中 设置 了 应 对 方 
案 ,否则 不 能 很 好 地 处 理 紧 急 情况 ,同时 ,还 需要 有 安全 措施 确保 机 器 人 不 会 伤害 操作 人 
员 以 及 与 它 一 起 工作 的 机 器 。 这 些 情况 包括 不 恰当 或 错误 的 反应 、 缺 乏 决策 的 能 力 、 断 
电 、 机 器 人 或 其 他 设备 的 损伤 人 员 伤 害 等 。 

机 器 人 尽管 在 一 定 情况 下 非常 出 众 ,但 其 能 力 在 自由 度 、 灵 巧 度 、 传 感 嚣 能力、 视觉 系 
统 、 实 时 响应 等 方面 仍 具 有 局 限 性 。 

另外 ,机 器 人 替代 了 工人 ,也 由 此 带 来 经 济 和 社会 问题 ,如 工人 的 失业 、 情 绪 上 的 不 满 
与 怨恨 等 。 

机 器 人 的 这 些 特性 决定 了 机 器 人 技术 的 迅速 发 展 及 其 在 众多 领域 中 的 广泛 应 用 。 


10.1.3 机 器 人 学 的 研究 领域 


机 器 人 学 有 着 极其 广泛 的 研究 和 应 用 领域 。 这 些 领 域 体现 出 广泛 的 学 科 交叉 ,涉及 
众多 的 课题 ,如 机 器 人 体系 结构 ,机构 ,控制 ,智能 、 传 感 .装配 、 恶 劣 环 境 下 的 机 器 人 以 及 
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机 器 人 语言 等 。 将 机 器 人 看 成 是 一 个 智能 系统 ,这 些 研 究 课题 概括 地 可 以 分 为 机 器 人 的 
感知 .机 器 人 的 思维 、 机 器 人 的 学 习 、 机 器 人 的 行动 。 

1. 传感器 与 感知 系统 

感知 是 机 器 人 必须 具备 的 功能 ,也 是 研究 的 重要 领域 ,其 中 包括 各 种 新 型 传感器 ( 视 
觉 、. 触 觉 . 听 觉 、 接 近 感 力 觉 ,临场 感 等 ) 的 开发 .多 传感器 系统 与 传感器 融合 .主动 视觉 与 
高 速 运动 视觉 ,以 及 传感器 硬件 的 模块 化 .恶劣 工 况 下 的 传感器 技术 .连续 语言 理解 与 处 
理 、 传 感 器 系统 软件 支撑 .虚拟 现实 技术 等 。 

2. 规划 与 调度 

机 器 人 规划 是 在 众多 研究 领域 中 的 一 个 长 期 的 热点 问题 ,其 中 包括 环境 模型 的 描述 、 
路 径 规 划 、 任 务 规划 、 非 结构 环境 下 的 规划 ,不 确定 性 规划 、 协 作 规划 、 装 配 规 划 、 基 于 传 感 
信息 的 规划 等 ,还 包括 任务 调度 问题 。 

3. 机 器 学 习 

机 器 人 系统 的 学 习 能 力 始终 是 一 个 热点 话题 , 它 有 赖 于 机 器 学 习 技 术 的 进展 与 突破 ， 
尤其 是 针对 人 类 未 知 环境 的 探索 ,更 需要 机 器 学 习 。 

4. 机 器 人 的 驱动 . 建 模 与 控制 

无 论 是 传统 的 工业 机 器 人 ,还 是 智能 机 器 人 ,都 不 仅 需要 进行 自身 的 运动 ,而 且 需 要 
执行 各 种 各 样 的 任务 。 这 就 给 机 器 人 研究 提出 了 许多 课题 。 从 执行 机 构 研制 ,到 驱动 器 
( 超 低 惯性 驱动 马达 ,直流 驱动 与 交流 驱动 ) 的 开发 ;从 系统 动力 学 的 分 析 , 到 控制 技术 的 
研究 ;从 控制 机 理 、 控 制 系统 结构 的 设计 ,到 控制 算法 的 改进 ;从 机 器 人 自身 的 功能 实现 ， 
到 智能 人 机 接口 等 。 

由 此 可 见 , 机 器 人 学 是 综合 机 械 电子 技术 、 信 息 处 理 技术 控制 科学 与 工程 .计算 机 科 
学 与 技术 .智能 科学 与 技术 等 多 学 科 的 交叉 与 综合 。 


10.2 机 器 人 系统 





10.2.1 机 器 人 系统 的 组 成 


单独 的 机 器 人 只 有 与 其 他 装置 ,周边 设备 以 及 其 他 生产 机 械 配合 使 用 才能 有 效 地 发 
挥 作 用 。 它 们 通常 集成 一 个 系统 ,该 系统 作为 一 个 整体 完成 任务 或 执行 操作 。 

机 器 人 作为 一 个 系统 ,由 如 下 部 件 构成 ,如 图 10-1 所 示 , 在 不 至 于 引起 歧义 的 情况 
下 ,我 们 通常 将 机 器 人 系统 简称 为 机 器 人 。 

1. 机 械 手 或 移动 车 

这 是 机 器 人 的 主体 部 分 ,由 连 杆 或 活动 关节 以 及 其 他 结构 部 件 构成 。 如 果 没 有 其 他 
部 件 , 仅 机 械 手 并 不 是 机 器 人 。 

2. 末端 执行 器 

末端 执行 器 是 指 连 接 在 机 械 手 最 后 一 个 关节 上 的 部 件 ,一 般 用 来 抓 取 物体 ,与 其 他 机 
构 连接 并 执行 需要 的 任务 。 机 器 人 制造 商 一 般 不 设计 或 出 售 末端 执行 器 ,多 数 情况 下 ,他 
们 只 提供 一 个 简单 的 抓 持 器 。 一 般 来 说 ,机 器 人 手 部 都 备 有 能 连接 专用 末端 执行 器 的 接 
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图 10-1 机 器 人 系统 示意 图 


口 , 这 些 末端 执行 器 是 为 某 种 用 途 专门 设计 的 ,未 端 执行 器 的 设计 通常 由 公司 工程 师 或 外 
面 的 顾问 完成 。 这 些 末 端 执 行 器 安装 在 机 器 人 上 完成 给 定 环境 中 的 任务 ,如 焊接 、 喷 漆 、 
涂 胶 以 及 零件 装 印 等 少数 儿 个 可 能 需要 机 器 人 完成 的 任务 。 通 常 ,未 端 执行 器 的 工作 由 
机 器 人 控制 器 直接 控制 ,或 将 机 器 人 控制 器 的 控制 信号 传 至 末端 执行 器 本 身 的 控制 装置 。 

3. 驱动 器 

驱动 器 是 机 械 手 的 “肌肉 "。 常 见 的 驱动 器 有 伺服 电动 机 、 步 进 电动 机 ` 气缸 及 液压 仙 
等 ,还 有 一 些 用 于 某 些 特殊 场合 的 新 型 驱动 器 。 驱 动 器 受 控制 器 的 控制 。 

4. 传感器 

传感器 用 来 收集 机 器 人 内 部 状态 的 信息 或 用 来 与 外 部 环境 进行 通信 。 像 人 一 样 ,机 
器 人 控制 器 也 需要 知道 每 个 连 杆 的 位 置 才能 知道 机 器 人 的 总 体 构 型 。 人 即使 在 完全 黑暗 
中 ,也 会 知道 腹 膊 和 腿 在 哪里 ,这 是 因为 肌 腿 内 的 中 枢 神 经 系统 中 的 神经 传感器 将 信息 反 
馈 给 了 人 的 大 脑 ,大 脑 利用 这 些 信 息 测定 肌肉 伸缩 程度 ,进而 确定 腹 膊 和 腿 的 状态 。 机 器 
人 同样 如 此 ,集成 在 机 器 人 内 的 传感器 将 每 一 个 关节 和 连 杆 的 信息 发 送 给 控制 器 ,于 是 控 
制 器 就 能 决定 机 器 人 的 构 型 。 机 器 人 常 配 有 许多 外 部 传感器 ,如 视觉 系统 .触觉 传感器 、 
语言 合成 器 等 ,以 使 机 器 人 能 与 外 界 进 行 通信 。 

5. 控制 器 

机 器 人 控制 器 与 人 的 小 脑 十 分 相似 ,虽然 小 脑 的 功能 没有 人 的 大 脑 功能 强大 ,但 它 却 
控制 着 人 的 运动 。 机 器 人 控制 器 从 计算 机 获取 数据 ,控制 驱动 器 的 动作 ,并 与 传 感 反 馈 信 
息 一 起 协调 机 器 人 的 运动 。 假 如 要 机 器 人 从 箱 柜 里 取出 一 个 零件 ,第 一 关节 角度 必须 为 
35 ,如 果 第 一 关节 尚未 达到 这 一 角度 ,控制 器 就 会 发 出 一 个 信号 到 驱动 器 (输送 电流 到 电 
动机 、 输 送气 体 到 气缸 或 发 送信 号 到 液压 缸 的 伺服 阀 ) ,使 驱动 器 运动 ,然后 通过 关节 上 的 
反馈 传感器 (电位 器 或 编码 器 等 ) 测 量 关节 角度 的 变化 , 当 关 节 达 到 预定 角度 时 ,停止 发 送 
控制 信号 ,对 于 更 复杂 的 机 器 人 ,机 器 人 的 运动 速度 和 力也 由 控制 器 控制 。 

6. 处 理 器 

处 理 器 是 机 器 人 的 大 脑 ,用 来 计算 机 器 关节 的 运动 ,确定 每 个 关节 应 移动 多 少 和 多 远 
才能 达到 预定 的 速度 和 位 置 ,并 且 监 督 控制 器 与 传感器 协调 动作 。 处 理 器 通常 就 是 一 台 
计算 机 ,只 不 过 是 一 种 专用 计算 机 , 它 也 需要 拥有 操作 系统 、 程 序 和 像 监 视 器 那样 的 外 部 
设备 等 ,同时 , 它 在 许多 方面 也 具有 与 PC 处 理 器 同样 的 功能 和 局 限 性 。 
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7. 软件 

用 于 机 器 人 的 软件 大 致 有 三 块 : 第 一 块 是 操作 系统 ,用 来 操作 计算 机 ;第 二 块 是 机 器 
人 软件 , 它 根据 机 器 人 的 运动 方程 计算 每 一 个 关节 的 必要 动作 ,然后 将 这 些 信息 传送 到 控 
制 器 ,这 种 软件 有 多 种 级 别 , 即 从 机 器 语言 到 机 器 人 使 用 的 复杂 高 级 语言 不 等 ;第 三 块 是 
例 行 程序 集合 和 应 用 程序 ,它们 是 为 了 使 用 机 器 人 外 部 设备 而 开发 的 (如 视觉 通用 程序 ) 
或 者 是 为 了 执行 特定 任务 而 开发 的 。 

值得 注意 的 是 ,在 许多 系统 中 ,控制 器 和 处 理 器 放置 在 同一 单元 中 ,虽然 这 两 部 分 放 
在 同一 装置 盒 内 ,甚至 集成 在 同一 电路 中 ,但 它们 有 各 自 的 功能 。 


10.2.2 机 器 人 的 工作 空间 


根据 机 器 人 的 构 型 、 连 杆 及 腕 关节 的 大 小 ,机 器 人 能 到 达 的 点 的 集合 称 为 工作 空间 。 
每 个 机 器 人 的 工作 空间 形状 都 与 机 器 人 的 特性 指标 密切 相关 。 工 作 空间 可 以 用 数学 方法 
通过 列 写 方程 确定 ,这 些 方程 规定 了 机 器 人 连 杆 与 关节 的 约束 条 件 , 这 些 约 束 条 件 可 能 是 
每 个 关节 的 动作 范围 。 除 此 之 外 ,工作 空间 还 可 以 赁 经 验 确定 ,可 以 使 每 一 个 关节 在 其 运 
动 范围 内 和 运动。 然后 将 其 可 以 到 达 的 所 有 区 域 连接 起 来 ,再 除去 机 器 人 无 法 到 达 的 区 域 。 
当 机 器 人 用 作 特 殊 用 途 时 ,必须 研究 其 工作 空间 ,以 确保 机 器 人 能 到 达 要 求 的 点 。 要 准确 
地 确定 工作 空间 ,可 以 参考 生产 商 提供 的 数据 。 

下 面 介 绍 机 器 人 工作 空间 涉及 的 两 个 重要 概念 。 


1. 自由 度 
自由 度 是 机 器 人 的 一 个 重要 技术 指标 ,是 由 机 器 人 的 结构 决定 ,并 直接 影响 机 器 人 的 
机 动 性 。 


为 了 确定 点 在 空间 的 位 置 ,需要 指定 三 个 坐标 ,就 像 沿 直角 坐标 轴 的 rz,y 和 x 三 个 
坐标 ,要 确定 该 点 的 位 置 ,必须 要 有 (也 只 要 有 ) 三 个 坐标 。 虽 然 这 三 个 坐标 可 以 用 不 同 的 
坐标 系 表 示 ,但 没有 坐标 系 是 不 行 的 。 然 而 ,不 能 用 两 个 或 四 个 坐标 ,因为 两 个 坐标 不 能 
确定 点 在 空间 的 位 置 ,而 三 维 空间 不 可 能 有 四 个 坐标 。 同 样 , 如 果 考 虑 一 个 三 自由 度 的 三 
维 装置 ,在 它 的 工作 区 内 可 以 将 任意 一 点 放 到 所 期 望 的 位 置 ,例如 , 台 架 (z,y'z) 起 重 机 
可 以 将 一 个 球 放 到 它 工 作 区 内 操作 员 指 定 的 任 一 位 置 。 

同样 ,要 确定 一 个 刚体 (一 个 三 维 物体 ,而 不 是 一 个 点 ) 在 空间 的 位 置 ,首先 需要 在 该 
刚体 上 选择 一 个 点 并 指定 该 点 的 位 置 , 因 此 需要 三 个 数据 确定 该 点 的 位 置 。 然 而 ,即使 物 
体 的 位 置 已 确定 , 仍 有 无 数 种 方法 确定 物体 关于 所 选 点 的 姿态 ,为 了 完全 定位 空间 的 物 
体 ,除了 确定 物体 上 所 选 点 的 位 置 外 ,还 须 确 定 该 物体 的 姿态 (如 飞机 的 俯仰 、 偏 航 、 滚 
动 )。 这 就 意味 着 需要 六 个 数据 ,才能 完全 确定 刚体 物体 的 位 置 和 姿态 (以 下 简称 位 姿 ) 。 
基于 同样 的 理由 ,需要 有 六 个 自由 度 才能 将 物体 放 署 到 空间 的 期 望 位 姿 。 如 果 少 于 六 个 
自由 度 , 机 器 人 的 能 力 将 受到 很 大 限制 。 

为 了 说 明 这 个 问题 ,考虑 一 个 三 自由 度 机 器 人 , 它 只 能 沿 zx,y 和 x 轴 和 运动 ,在 这 种 情 
况 下 ,不 能 指定 机 械 手 的 姿态 ,此 时 ,机 器 人 只 能 夹 持 物件 做 平行 于 坐标 轴 的 运动 。 姿 态 
保持 不 变 ; 再 假设 一 个 机 器 人 有 五 个 自由 度 , 可 以 绕 三 个 坐标 轴 旋 转 , 但 只 能 沿 z 和 y 轴 
移动 ,这 时 虽然 可 以 任意 指定 姿态 ,但 只 能 沿 x 和 y 轴 , 而 不 可 能 沿 = 轴 给 部 件 定位 。 
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具有 七 个 自由 度 的 系统 没有 唯一 解 。 这 就 意味 着 ,如 果 一 个 机 器 人 有 七 个 自由 度 , 那 
么 机 器 人 可 以 有 无 穷 多 种 方法 在 期 望 位 置 为 部 件 定位 和 定 姿 。 为 了 使 控制 器 知道 具体 怎 
么 做 ,必须 附加 的 决策 程序 使 机 器 人 能 够 从 无 数 种 方法 中 只 选择 一 种 。 例 如 ,可 以 采用 最 
优 程序 选择 最 快 或 最 短路 径 到 达 目 的 地 。 为 此 ,计算 机 必须 检验 所 有 的 解 ,从 中 找 出 最 短 
或 最 快 的 响应 并 执行 。 由 于 这 种 额外 的 需要 会 耗费 许多 计算 时 间 , 因 此 这 种 七 个 自由 度 
的 机 器 人 在 工业 中 是 不 采用 的 。 

与 之 类 似 的 问题 是 ,假如 一 个 机 械 手 机 器 人 安装 在 一 个 活动 的 基 座 上 ,如 移动 平台 或 
传送 带 上 , 则 这 台 机 器 人 就 有 宛 余 的 自由 度 。 基 于 前 面 的 讨论 ,这 种 自由 度 是 无 法 控制 
的 。 机 器 人 能 够 从 传送 带 或 移动 平台 的 无 数 不 确 定 的 位 置 上 到 达 所 要 求 的 位 姿 , 这 时 虽 
然 有 太 多 的 自由 度 , 但 这 种 多 余 的 自由 度 一 般 来 说 不 去 求解 。 换 言 之 , 当 机 器 人 安装 在 传 
送 带 上 或 是 可 移动 时 ,机 器 人 基 座 相对 于 传送 带 或 其 他 参考 坐标 系 的 位 置 是 已 知 的 。 由 
于 基 座 的 位 置 无 需 由 控制 器 决定 ,自由 度 的 个 数 实际 上 仍 为 六 个 ,因而 解 是 唯一 的 。 只 要 
机 器 人 基 座 在 传送 带 或 移动 平台 上 的 位 置 已 知 ( 或 已 选 定 ) ,就 没有 必要 靠 求解 一 组 机 器 
人 运动 方程 找到 机 器 人 基 座 的 位 置 ,从 而 系统 得 以 求解 。 

对 于 机 器 人 系统 ,从 来 不 将 末端 执行 器 考虑 为 一 个 自由 度 , 所 有 的 机 器 人 都 有 该 附加 
功能 , 它 看 起 来 类 似 于 一 个 自由 度 , 但 末端 执行 器 的 动作 并 不 计 入 机 器 人 的 自由 度 。 

机 器 人 的 自由 度 主要 由 各 种 关节 实现 ,主要 有 滑动 关节 、 回 转 关 节 和 球 型 关节 等 ,大 
多 数 使 用 的 是 滑动 关节 和 回转 关节 。 滑 动 关节 是 线性 的 , 它 不 包括 旋转 运动 ,气缸 、 液 压 
饶 或 者 线性 电 驱 动 器 驱动 ,主要 用 于 台 架 构 型 .圆柱 构 型 或 类 似 的 关节 构 型 。 回 转 关 节 是 
旋转 型 的 ,虽然 液压 和 气动 旋转 关节 使 用 十 分 普遍 ,但 大 部 分 旋转 关节 是 电动 的 。 它 们 由 
步 进 电动 机 驱动 或 者 更 普遍 地 采用 伺服 电动 机 驱动 。 

有 一 种 特殊 情况 ,虽然 关节 是 能 够 活动 的 ,但 它 的 运动 并 不 完全 受 控制 器 控制 。 例 
如 ,假设 一 个 线性 关节 由 一 个 气缸 驱动 ,其 上 的 手臂 可 以 全 程 伸 开 ,也 可 全 程 收缩 ,但 不 能 
控制 它 在 两 个 极限 之 间 的 位 置 。 在 这 种 情况 下 ,通常 把 这 个 关节 的 自由 度 确定 为 1/2, 这 
表示 这 个 关节 只 能 在 它 的 运动 极限 内 定位 。 自 由 度 为 1/2 的 另 一 个 含义 是 只 能 对 该 关节 
赋予 一 些 特定 值 ,例如 ,假设 一 个 关节 的 角度 只 能 为 0、30"、60 和 90 ,那么 如 前 所 述 , 该 
关节 被 限定 为 只 有 几 个 可 能 的 取 值 ,从 而 是 一 个 受 限 的 自由 度 。 

许多 工业 机 器 人 的 自由 度 都 少 于 6 个 ,实际 上 ,自由 度 为 3.5 个 .4 个 和 5 个 的 机 器 
人 非常 普遍 。 只 要 没有 对 附加 自由 度 的 需要 ,这 些 机 器 人 都 能 够 很 好 地 工作 。 例 如 ,假设 
将 电子 元 件 插入 电路 板 , 电 路 板 放 在 一 个 给 定 的 工作 台面 上 ,此 时 ,电路 板 相对 于 机 器 人 
基 座 的 高 度 (z 坐标 ) 是 已 知 的 。 因 此 ,只 需要 沿 工 轴 和 > 轴 方 向 上 的 两 个 自由 度 就 可 以 
确定 元 件 插入 电路 板 的 位 置 。 另 外 ,假设 元 件 要 按 某 个 方位 插入 电路 板 ,而 且 电 路 板 是 平 
的 。 此 时 则 需要 一 个 绕 垂直 轴 (z) 旋 转 的 自由 度 ,才能 在 电路 板 上 给 元 件 定向 。 由 于 这 里 
还 需要 一 个 1/2 自由 度 ,以 便 能 完全 伸展 末端 执行 器 插入 元 件 , 或 者 在 运动 前 能 完全 收缩 
将 机 器 人 抬 起 。 因 而 总 共 需 要 3. 5 个 自由 度 ,其 中 两 个 自由 度 用 于 在 电路 板 的 上 方 做 出 
运动 ,一 个 用 来 旋转 元 件 ,还 有 0. 5 个 自由 度 用 来 插入 和 缩 回 。 插 装机 器 人 广泛 应 用 于 电 
子 工业 ,它们 的 优点 是 编程 简单 .价格 适中 、 体 积 小 、 速 度 快 。 它 们 的 缺点 是 虽然 它们 可 以 
用 编程 实现 在 任意 型 号 的 电路 板 上 以 任意 的 方位 插入 元 件 ,以 完成 在 设计 范围 内 的 一 系 
列 工作 ,但 是 它们 不 能 从 事 除 此 以 外 的 其 他 工作 。 它 们 的 工作 能 力 受到 只 有 3.5 个 自由 
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度 的 限制 ,但 在 该 限制 范围 内 仍 可 以 完成 许多 不 同 的 事 。 

2. 机 器 人 的 参考 坐标 系 

机 器 人 可 以 相对 于 不 同 的 坐标 系 运 动 ,在 每 一 种 坐标 系 中 的 运动 都 不 相同 。 通 常 , 机 
器 人 运动 在 以 下 三 种 坐标 系 中 完成 。 

1) 全 局 参考 坐标 系 

全 局 参考 坐标 系 是 一 种 通用 坐标 系 ,由 x,y 和 x 轴 定 义 。 在 此 情况 下 ,通过 机 器 人 
关节 的 同时 运动 产生 沿 3 个 主轴 方向 的 合成 运动 。 在 这 种 坐标 系 中 ,无 论 手臂 在 哪里 ,x 
轴 的 正 向 运动 总 是 在 z 轴 的 正方 向 。 这 一 坐标 通常 用 来 定义 机 器 人 相对 于 其 他 物体 的 
运动 .与 机 器 人 通信 的 其 他 部 件 以 及 运动 路 径 。 

2) 关节 参考 坐标 系 

关节 参考 坐标 系 用 来 描述 机 器 人 每 一 个 独立 关节 的 运动 。 假 设 希 望 将 机 器 手 运动 到 
一 个 特定 的 位 置 ,可 以 每 次 只 运动 一 个 关节 ,从 而 把 手 引 导 到 期 望 的 位 置 上 。 在 这 种 情况 
下 ,每 一 个 关节 单独 控制 ,从 而 每 次 只 有 一 个 关节 运动 。 由 于 所 用 关节 的 类 型 (滑动 型 . 旋 
转型 . 球 型 ) 不 同 ,机 器 人 手 的 动作 也 各 不 相同 。 例 如 ,如 果 旋 转 关节 运动 ,那么 机 器 人 手 
将 绕 着 关节 的 轴 旋 转 。 

3) 工具 参考 坐标 系 

工具 参考 坐标 系 描述 机 器 人 手相 对 于 固 连 在 手 上 的 坐标 系 的 运动 。 固 连 在 手 上 的 
zy 和 x 轴 定 义 了 手相 对 于 本 地 坐标 系 的 运动 。 与 通用 的 全 局 坐标 系 不 同 ,工具 坐标 系 
随机 器 人 一 起 运动 。 工 具 坐 标 系 是 一 个 活动 的 坐标 系 , 当 手臂 运动 时 , 它 也 随 之 不 断 改 
变 , 因 此 , 随 之 产生 的 相对 于 它 的 运动 也 不 相同 。 它 取决 于 手臂 的 位 置 以 及 工具 坐标 系 的 
姿态 。 机 器 人 所 有 的 关节 必须 同时 运动 .才能 产生 关于 工具 坐标 系 的 协调 运动 。 在 机 器 
人 编程 中 ,工具 坐标 系 是 一 个 极其 有 用 的 坐标 系 , 使 用 它 便 于 对 机 器 人 靠近 、 离 开 物 体 或 
安装 零件 进行 编程 。 


10.2.3 机 器 人 的 性 能 指标 


机 器 人 的 主要 性 能 指标 包括 以 下 4 项 。 

1. 负荷 能 力 

负荷 能 力 是 机 器 人 在 满足 其 他 性 能 要 求 的 情况 下 ,能 够 承载 的 负荷 重量 。 例 如 ,一 台 
机 器 人 的 最 大 负荷 能 力 可 能 远大 于 它 的 额定 负荷 能 力 。 但 是 ,达到 最 大 负荷 时 ,机 器 人 的 
工作 精度 可 能 会 降低 ,可 能 无 法 准确 地 沿 着 预定 的 轨迹 运动 .或 者 产生 和 额外 的 偏差 。 机 器 
人 的 负荷 量 与 其 自身 的 重量 相 比 往往 非常 小 。 例 如 ,Fanuc Tonorics LRMate 机 器 人 自 
身 重 86 磅 ( 约 39kg) ,而 其 负荷 量 仅 为 6. 6 磅 (1 磅 之 0.4536kg);M-16i 机 器 人 自身 重 594 
磅 ,而 其 负荷 量 仅 为 35 磅 。 

2. 运动 范围 

运动 范围 是 机 器 人 在 其 工作 区 域内 可 以 达到 的 最 大 距离 。 机 器 人 可 按 任意 姿态 达到 
其 工作 区 域内 的 许多 点 (这 些 点 为 灵巧 点 )。 然 而 ,对 于 其 他 一 些 接近 于 机 器 人 运动 范围 
的 极限 点 , 则 不 能 任意 指定 其 姿态 (这 些 点 称 为 非 灵巧 点 )。 运 动 范围 是 机 器 人 关节 长 度 
和 其 构 型 的 函数 。 
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3. 精度 (正确 性 ) 

精度 是 指 机 器 人 到 达 指 定点 的 精确 程度 , 它 与 驱动 的 分 辩 率 以 及 反馈 装置 有 关 。 大 
多 数 工 业 机 器 人 都 具有 0. 001 英寸 (1 英寸 二 0.0254m) 或 者 更 高 的 精度 。 

4. 重复 精度 (变化 性 ) 

重复 精度 是 指 如 果 动 作 重 复 多 次 ,机 器 人 到 达 同 样 位 置 的 精确 程度 。 假 设 驱动 机 器 
人 到 达 同 一 点 100 次 ,由 于 许多 因素 会 影响 人 的 位 置 精 度 , 机 器 人 不 可 能 每 次 都 能 准确 地 
到 达 同 一 点 ,但 应 在 以 该 点 为 圆心 的 一 个 圆 区 范围 内 。 该 圆 的 半径 是 由 一 系列 重复 动作 
形成 的 。 这 个 半径 即 重复 精度 。 重 复 精 度 比 精度 更 重要 。 如 果 一 个 机 器 人 定位 不 够 精 
确 ,通常 会 显示 一 个 固定 的 误差 ,这 个 误差 是 可 以 预测 的 ,因此 可 以 通过 编程 予以 校正 , 例 
如 ,假设 一 个 机 器 人 总 是 向 右 偏离 0.05 英寸 ,那么 可 以 规定 所 有 的 位 置 点 向 左 偏 移 0. 05 
英寸 ,这 样 就 消除 了 偏差 。 然 而 ,如 果 误 差 是 随机 的 , 那 它 就 无 法 预测 ,因此 也 就 无 法 消 
除 。 重 复 精度 限定 了 这 种 随机 误差 的 范围 。 通 常 通过 一 定 次 数 地 重复 运行 机 器 人 来 测 
定 ,测试 次 数 越 多 ,得 出 的 重复 精度 范围 越 大 (对 生产 商 是 坏事 ) ,也 越 接近 实际 情况 (对 用 
户 是 好 事 )。 生 产 商 给 出 重复 精度 时 必须 同时 给 出 测试 次 数 ,测试 过 程 中 所 加 负载 及 手臂 
的 姿态 。 例 如 ,手臂 的 重复 精度 在 垂直 方向 与 在 水 平方 向 测 得 的 结果 是 不 同 的 。 大 多 数 
工业 机 器 人 的 重复 精度 都 在 0.001 英寸 以 内 。 


10.3 机 器 人 的 编程 模式 与 语言 


根据 机 器 人 及 其 复杂 程度 的 不 同 , 可 用 多 种 模式 为 机 器 人 编程 。 以 下 是 一 些 常用 的 
编程 模式 。 

1. 硬件 逻辑 结构 模式 

在 这 个 模式 中 ,操作 员 操 纵 开 关 和 起 停 按 钮 控制 机 器 人 的 运动 。 这 种 模式 常 与 其 他 
装置 配合 使 用 ,例如 可 编程 序 逻 辑 控制 器 (PLC)。 

2. 引导 或 示 教 模式 

在 这 种 模式 中 ,机 器 人 的 各 个 关节 随 示 教 杆 运动 , 当 达 到 期 望 的 位 姿 时 ,位 姿 信 息 送 
入 控制 器 。 在 再 现 过 程 中 ,控制 器 控制 各 关节 运动 到 相同 的 位 姿 ,这 种 方式 常用 于 点 对 点 
控制 ,而 不 指定 或 控制 两 点 之 间 的 运动 。 它 只 保证 示 教 的 各 点 到 位 。 

3. 连续 轨迹 示 教 模式 

在 这 种 模式 中 ,机 器 人 的 所 有 关节 同时 运动 ,此 时 机 器 人 的 运动 是 连续 采样 的 ,并 由 
控制 器 记录 运动 信息 。 在 再 现 过 程 中 ,按照 记录 的 信息 准确 地 执行 动作 。 操 作 员 给 机 器 
人 示 教 通常 有 两 种 方法 : 一 种 是 通过 模型 实际 运动 末端 执行 器 ; 另 一 种 是 直接 引导 机 器 
人 手臂 在 它 的 工作 空间 中 运动 。 例 如 ,熟练 的 喷漆 工人 就 是 通过 这 种 方式 为 喷漆 机 器 人 
编程 。 

4. 软件 模式 

在 这 种 机 器 人 编程 模式 中 ,可 以 采用 离线 或 在 线 的 方式 进行 编程 ,然后 由 控制 器 执行 
这 些 程序 ,并 控制 机 器 人 的 运动 。 这 种 编程 模式 最 先进 和 通用 。 它 可 包含 传感器 信息 、 条 
件 语句 (诸如 if…then 语句 ) 和 分 支 语句 等 。 然 而 ,在 编写 程序 前 必须 掌握 机 器 人 操作 系 
统 的 知识 。 
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大 部 分 工业 机 器 人 都 具有 一 种 以 上 的 编程 模式 。 

机 器 人 编程 语言 的 种 类 可 能 与 机 器 人 的 种 类 一 样 多 ,每 一 个 生产 商都 会 设计 他 们 自 
己 的 机 器 人 语言 ,因此 ,为 了 使 用 某 一 特定 机 器 人 ,必须 学 习 相 关 的 语言 。 许 多 机 器 人 语 
言 是 以 常用 语言 (如 Cobol、Basic、C 和 Fortran) 为 基础 派生 出 来 的 ,也 有 一 些 机 器 人 语言 
是 独特 设计 的 ,并 与 其 他 常用 语言 无 直接 联系 。 

机 器 人 语言 根据 其 设计 和 应 用 的 不 同 有 不 同 的 复杂 性 级 别 ,其 级 别 范围 从 机 器 级 到 
已 提出 的 人 类 智能 级 不 等 。 许 多 机 器 人 语言 是 解释 执行 的 ,如 Unimarion 的 VAL 和 
AML(A Manufacturing Language) 都 是 解释 程序 。 也 有 些 语 言 (如 AL) 比 较 灵 活 ,它们 
允许 用 户 用 解释 模式 进行 调试 ,而 用 编译 模式 执行 。 

下 面 对 不 同 级 别 的 机 器 人 语言 进行 简要 描述 。 

(1) 微型 计算 机 机 器 级 语言 。 在 这 一 级 ,程序 是 用 机 器 语言 编写 的 ,这 一 级 的 编程 是 
最 基本 的 ,也 是 非常 有 效 的 ,但 是 难以 理解 和 学 习 , 所 有 的 语言 最 终 都 翻译 或 编译 成 机 器 
语言 。 然 而 ,用 高 级 语言 编写 的 程序 比较 容易 学 习 和 理解 。 

(2) 点 对 点 级 语言 。 在 这 一 级 语言 中 (如 Funky 和 Cincinnart Milacron 的 T3) 依 次 
输入 每 一 点 的 坐标 ,机 器 人 就 按照 给 出 的 点 运动 。 这 是 非常 原始 和 简单 的 程序 类 型 , 它 易 
于 使 用 ,但 功能 不 够 强大 , 它 也 缺乏 程序 分 支 、 传 感 器 信息 及 条 件 语句 等 基本 功能 。 

(3) 专用 操作 语言 。 该 语言 是 专门 用 于 机 器 人 领域 的 语言 ,也 可 能 发 展 成 为 通用 的 
计算 机 编程 语言 。 用 该 级 语言 可 以 开发 较 复杂 的 程序 ,包含 传感器 信息 ,程序 分 支 以 及 条 
件 语句 (如 Unimation 公司 的 VAL)。 这 一 级 别 多 数 选用 解释 执行 的 语言 。 

(4) 应 用 计算 机 语言 的 结构 化 程序 级 语言 。 这 种 编程 语言 是 在 流行 的 计算 机 语言 
(如 C 语 言 ) 的 基础 上 增加 一 些 机 器 人 专用 的 子 程序 库 。 这 类 语言 大 多 数 是 编译 执行 , 功 
能 强大 ,允许 复杂 编程 ,如 美国 Cimflex 公司 开发 的 AR-BASIC 语言 就 是 用 BASIC 语言 
开发 的 一 个 程序 库 。 

(5) 面向 任务 的 语言 。 目 前 尚 不 存在 这 一 级 别 的 编程 语言 ,IBM 公司 于 20 世纪 80 
年 代 提 出 了 Autopass, 但 一 直 没 有 实现 ,Autopass 设想 成 为 面向 任务 的 编程 语言 ,也 就 是 
说 ,不 必 为 机 器 人 完成 任务 的 每 一 个 必要 步骤 都 编 好 程序 ,用 户 只 需 指 出 所 要 完成 的 任 
务 ,控制 器 就 会 生成 必要 的 程序 流程 。 假 设 机 器 人 要 将 一 批 盒 子 按 大 小 分 为 三 类 ,在 现 有 
的 语言 中 ,程序 必须 准确 告诉 机 器 人 要 做 什么 ,也 就 是 每 一 个 步骤 都 必须 编程 ,如 必须 首 
先 告 诉 机 器 人 如 何 运 动 到 最 大 的 盒子 处 ,如 何 捡 起 盒子 ,并 将 它 放 在 哪里 ,然后 再 运动 到 
下 一 个 盒子 的 地 方 ,等 等 。 在 Autopass 语言 中 ,用 户 只 需 给 出 “分 类 ”的 指令 ,机 器 人 控制 
器 便 会 自动 建立 这 些 动作 序列 。 


10.4 机 器 人 的 应 用 与 展望 


2009 年 年 底 已 有 76 600 台 专 用 服务 机 器 人 安装 使 用 ,其 中 军用 机 器 人 有 23 200 台 ， 
占 新 安装 的 专用 服务 机 器 人 总 数 的 30% ,农业 机 器 人 (主要 是 挤 奶 机 器 人 ) 占 25%% ,医疗 
机 器 人 和 清洁 机 器 人 各 占 8% .水 下 机 器 人 系统 占 7%% ,建筑 爆破 机 器 人 和 通用 移动 机 器 
人 平台 各 占 6% ,物流 系统 占 5% ,救援 和 安保 机 器 人 占 4%。 安 装 量 最 小 的 是 检测 机 器 
人 和 公关 机 器 人 。 增 长 比较 强劲 的 应 用 领域 为 救护 和 保安 机 器 人 、 农 业 机 器 人 、 物 流 系 
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统 、 检 测 机 器 人 、 医 疗 机 器 人 和 多 功能 移动 机 器 人 平台 。 

根据 国际 机 器 人 联合 会 (IFR) 的 数据 显示 ,2015 年 全 球 工业 机 器 人 销量 首次 突破 24 
万 台 , 其 中 亚洲 销量 约 占 全 球 销量 的 2/3, 销 量 为 14. 4 万 台 ; 欧 洲 地 区 为 5 万 台 , 其 中 东 
欧 地 区 销量 增 速 达到 29% ,是 全 球 增长 最 快 的 地 区 之 一 :北美 地 区 销量 达到 3. 4 万 台 。 
中 国 、 埋 国 、 日 本 .美国 和 德国 的 总 销量 占 全 球 销量 的 3/4。 中 国 、 美 国 、 韩 国 \ 日 本 、 德 国 、 
以 色 列 等 国 是 近年 工业 机 器 人 技术 、 标 准 及 市 场 发 展 较 活 跃 的 地 区 。2016 年 ,全 球 工业 
机 器 人 销量 约 29 万 台 , 同 比 增长 14% ,其 中 中 国 工 业 机 器 人 销量 9 万 台 , 同 比 增长 31% 。 
而 2016 年 年 底 中 国 机 器 人 产业 联盟 公布 的 42016 年 上 半年 工业 机 器 人 市 场 统 计数 据 》 显 
示 : 2016 年 上 半年 国内 机 器 人 企业 累计 销售 19 257 台 机 器 人 , 较 上 年 增长 37.7%, 增 速 
比 上 年 同期 加 快 10.2% ,实际 销量 比 上 年 增长 70. 8%。 


10.4.1 机 器 人 应 用 


进入 21 世纪 后 ,我 国 先后 研制 出 一 大 批 特种 机 器 人 并 得 到 应 用 ,如 辅助 骨 外 科 手 术 
机 器 人 和 脑 外 科 机 器 人 成 功用 于 临床 手术 ,低空 飞行 机 器 人 在 南极 科 考 中 得 到 应 用 ,微小 
型 探 雷 扫雷 机 器 人 参加 了 国际 维和 扫雷 行动 ,空中 搜索 探测 机 器 人 、 上 废墟 搜救 机 器 人 等 地 
震 搜救 机 器 人 成 功 问 世 ,细胞 注射 微 操 作 机 器 人 已 应 用 于 动物 克隆 实验 ,国内 首 台 腹 腔 微 
创 外 科 手 术 机 器 人 进行 了 动物 试验 并 通过 鉴定 ,反恐 排 爆 机 器 人 已 经 批量 装备 公安 和 武 
警部 队 ; 水 下 机 器 人 在 海底 资源 勘探 ,北极 科 考 等 领域 获得 成 功 应 用 。 

2017 世界 机 器 人 大 会 展示 了 15 款 机 器 人 : 画家 机 器 人 、 钢 琴 家 机 器 人 、 写 字 机 器 人 、 
水 母 机 器 人 、 智 能 编程 机 器 人 、 医 疗 机 器 人 、 舞 蹈 机 器 人 、 讲 解 员 机 器 人 、 记 者 机 器 人 、 仿 生 
机 器 晴 是 、 会 打 羽 毛 球 的 机 器 人 、 投 篮 机 器 人 、 变 脸 机 器 人 、 舞 狮 机 器 人 、 美 女 机 器 人 。 

下 面 从 特种 机 器 人 、 工 业 机 器 人 和 服务 机 器 人 等 方面 介绍 机 器 人 应 用 情况 。 

1. 特种 机 器 人 

当前 ,我 国 特种 机 器 人 市 场 保持 较 快 发 展 , 各 种 类 型 不 断 出 现 , 在 应 对 地 震 、 洪 涝 和 极 
端 天 气 , 以 及 矿难 、 火 灾 、 安 防 等 公共 安全 事件 中 ,对 特种 机 器 人 有 着 突出 的 需求 。2016 
年 ,我 国 特 种 机 器 人 市 场 规模 达到 6. 3 亿美 元 , 增 速达 到 16.7%, 略 高 于 全 球 特种 机 器 人 
增 速 。 军事 应 用 机 器 人 、 极 限 作业 机 器 人 和 应 急救 援 机 器 人 市 场 规模 分 别 为 4. 8 亿美 元 、 
1.1 亿美 元 和 0.4 亿美 元 ,其 中 极限 作业 机 器 人 是 增 速 最 快 的 领域 。 

1) 地 面 军用 机 器 人 

地 面 机 器 人 主要 是 指 智 能 或 遥控 的 轮 式 和 履带 式 车 辆 。 地 面 军 用 机 器 人 又 可 分 为 自 
主 车 辆 和 半 自 主 车 辆 。 自 主 车 辆 依靠 自身 的 智能 自主 导航 ,躲避 障碍 物 ,独立 完成 各 种 战 
斗 任务 ; 半 自 主 车 辆 可 在 人 的 监视 下 自主 行使 , 遇 到 困难 时 操作 人 员 可 以 进行 禹 控 干 预 。 

2008 年 3 月 ,美国 官方 公布 了 一 段 关 于 军用 机 器 人 的 录像 ,视频 中 的 机 器 人 名 为 “大 
狗 ”(BigDog) ,拥有 惊人 的 活动 能 力 和 适应 性 ,即便 是 被 狠 狠 踏 上 一 脚 ,也 能 迅速 重新 保 
持平 衡 。 这 个 “大 狗 ? 机 器 人 吸引 了 众多 关注 的 目光 , 它 的 视频 也 在 互联 网 上 造成 又 动 。 

“大 狗 ? 机 器 人 拥有 非常 强 的 平衡 能 力 , 无 论 是 爬 陡 坡 , 跨 崎 虹 路 段 , 还 是 在 冰 面 或 者 
雪 地 上 , 它 都 能 够 行走 自如 ,甚至 在 被 人 猛 地 踏 上 一 脚 后 ,“ 大 狗 ” 也 能 迅速 调整 恢复 身体 
的 平衡 。 最 新 款 “ 大 狗 ” 可 以 攀 越 35 的 斜坡 ,可 承载 40 多 千克 的 装备 , 约 相当 于 其 自重 的 
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30%,“ 大 狗 ” 还 可 以 自行 沿 着 简单 的 路 线 行进 ,或 是 被 远程 控制 。 

“大 狗 ” 项 目 由 美国 国防 部 高 级 研究 计划 署 (DARPA) 资 助 ,该 机 构 希 望 它 可 以 在 军 
车 难以 出 入 的 险要 地 段 助 士兵 一 辟 之 力 。“ 大 狗 ” 有 能 力 在 战场 上 为 土 兵 运 送 弹 药 、 食 物 
和 其 他 物品 。 

2012 年 ,美国 国防 部 高 级 研究 计划 署 委 托 波士顿 动力 工程 公司 研制 的 机 器 人 “猎豹 ” 
以 每 小 时 18 英里 (1 英里 二 1609. 344 米 ) 的 成 绩 打破 了 有 腿 机 器 人 的 陆地 步行 速度 最 高 
纪录 ,成 为 速度 最 快 的 四 腿 机 器 人 。“ 猫 鹏 ”的 目标 是 步行 速度 超过 人 类 ,成 为 能 够 逃避 人 
类 追捕 的 战场 机 器 人 。 

2014 年 7 月 ,谷歌 旋 下 公司 的 步兵 班组 支援 系统 (Legged Squad Support System， 
LS3) 机 器 狗 在 夏威夷 跟随 美国 海军 陆 战 队 进行 了 第 一 次 实地 运载 测试 。LS3 耗 时 5 年 
研发 ,在 24 小 时 不 进行 补给 情况 下 ,可 携带 181. 44kg 负载 行进 32. 18km, 还 能 在 树林 、 岩 
石 地 障碍 物 和 城区 等 复杂 地 形 中 跟随 士兵 行动 。 在 实际 测试 中 ,LS3 身 打 重 约 180 多 千 
克 的 武器 和 军用 设备 ,规矩 地 跟随 士兵 们 沿 着 指定 路 线 前 进 , 犹 如 一 只 训练 有 素 的 警犬 。 

2016 年 9 月 ,中 国 最 新 研制 的 “大 狗 ” 四 足 步行 机 器 人 公开 曝光 。 这 一 名 为 “奔跑 号 ” 
山地 四 足 仿生 移动 平台 的 中 国 国 产 机 器 人 参加 了 解放 军 陆 军装 备 部 “跨越 险阻 2016” 地 
面 无 人 系统 挑战 赛 ,一举 夺 得 50m 速度 .综合 越野 桂冠 。 

2) 无 人 机 

被 称 为 空中 机 器 人 的 无 人 机 是 军用 机 器 人 中 发 展 最 快 的 家 族 ,从 1913 年 第 一 台 自 动 
驾驶 仪 问世 以 来 ,无 人 机 的 基本 类 型 已 达到 300 多 种 .目前 在 世界 市 场 上 销售 的 无 人 机 有 
40 多 种 。 美 国 几乎 参加 了 世界 上 所 有 重要 的 战争 。 由 于 它 的 科学 技术 先进 ,国力 较 强 ， 
因而 80 多 年 来 ,世界 无 人 机 的 发 展 基本 上 是 以 美国 为 主线 向 前 推进 的 。 

目前 ,美国 已 经 装备 或 即将 装备 的 无 人 机 主要 有 “先锋 “猎手 “影子 “ 掠 食 者 “全 球 
应 ”等 。 在 美国 发 动 的 近 几 场 局 部 战争 中 必 全 球 应 交 掠 食 者 ”等 无 人 机 都 有 上 佳 表 现 。 以 
色 列 研制 成 第 一 代 * 侦 察 兵 ”(Scout) 无 人 机 、 第 二 代 * 先 锋 ”(Pioneer) 无 人 机 、 第 三 代 “ 搜 
索 者 ”(Searcher) 无 人 机 ,与 美国 TRW 公司 合作 研制 “猎人 ”(Hunter) 无 人 机 ,以 及 中 空 
长 航 时 多 用 途 “ 苍 医 ”(Heron) 无 人 机 。2010 年 11 月 ,中 国 在 珠海 国际 航 展 上 推出 25 款 
先进 的 无 人 机 。 

2017 年 ,美国 空军 研究 实验 室 开 展 了 无 人 机 模拟 对 抗 试 验 , 装 备 有 “阿尔 法 ”人 工 智 
能 的 无 人 机 多 次 轻松 击败 人 类 飞行 员 。 

3) 水 下 机 器 人 /无 人 艇 

水 下 机 器 人 分 为 有 人 机 器 人 和 无 人 机 器 人 两 大 类 。 有 人 潜水 器 机 动 灵活 ,便于 处 理 

杂 的 问题 ,但 是 操作 人 员 的 生命 可 能 会 有 危险 ,而 且 价 格 昂贵 。 无 人 潜水 器 就 是 人 们 说 
的 水 下 机 器 人 , 近 20 年 来 ,水 下 机 器 人 有 了 很 大 的 发 展 ,它们 既 可 军用 ,又 可 民用 。 按 照 
无 人 潜水 器 与 水 面 支持 设备 ( 母 船 或 平台 ) 间 联系 方式 的 不 同 ,水 下 机 器 人 可 以 分 为 两 大 
类 : 一 种 是 有 缆 水 下 机 器 人 ,习惯 上 把 它 称 作 禹 控 潜 水 器 .简称 ROV; 另 一 种 是 无 缆 水 下 
机 器 人 ,潜水 器 习惯 上 把 它 称 作 自 治 潜水 器 ,简称 AUV。 有 线 机 器 人 都 是 遥控 式 的 , 按 
其 运动 方式 分 为 拖 忠 式 、( 海 底 ) 移 动 式 和 浮游 ( 自 航 ) 式 三 种 。 无 缆 水 下 机 器 人 只 能 是 自 
治 式 的 ,目前 还 只 有 观测 型 浮游 式 一 种 运动 方式 .但 它 的 前 景 是 光明 的 。 

2012 年 3 月 26 日 ,詹姆斯 . 卡 梅 隆 驾驶 “深海 挑 战 者 ”号 深 潜 器 潜入 世界 最 深 处 (此 
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次 下 法 深度 为 10898m) ,成 为 目击 马里 亚 纳 海沟 底部 景象 第 一 人 。 目 前 国产 智能 水 下 机 
器 人 已 经 服役 并 正在 形成 系列 ,特别 是 中 国 科学 院 沈阳 自动 化 研究 所 与 俄罗斯 合作 的 
6000m 潜 深 的 CR-01 和 CR-02 系列 预 编程 控制 的 水 下 机 器 人 已 经 完成 太平 洋 深 海 的 考 
察 工作 ,达到 实用 水 平 。 

目前 ,中 国 智能 无 人 艇 生产 和 在 研 船型 繁多 、 可 搭载 多 种 调查 勘测 设备 ,适应 多 种 工 
作 环境 ,可 以 用 于 测 深 、 测 流 、 环 保 等 领域 ,特别 是 和 大 型 科 考 船 搭 配 使 用 ,可 适应 海洋 复 
杂 环境 ,更 好 地 实现 科 考 目标 。 精 海 3 号 (HC650-01) 由 交通 运输 部 东海 航海 保障 中 心 上 
海 海事 测绘 中 心 订购 ,其 主要 用 于 岛 礁 和 近海 浅水 域 等 水 下 地 形 、 地 貌 探 测 , 可 对 测量 船 
不 能 到 达 的 水 域 进行 数据 测量 、 采 集 等 工作 ,也 可 以 作为 一 个 搭载 平台 ,搭载 其 他 设备 , 完 
成 其 他 使 命 ( 如 海洋 环境 监测 等 )。2018 年 1 月 14 日 下 午 ,装载 着 11. 13 万 吨 凝 析 油 的 
巴拿马 籍 油轮 “ 桑 吉 轮 ” 因 撞 船 事故 沉没 。1 月 15 日 至 22 日 ,国家 海洋 局 东海 海洋 环境 
调查 勘察 中 心 联合 上 海 大 学 无 人 艇 工程 研究 院 运 用 * 精 海 3 号 ”无 人 艇 等 智能 手段 ,对 “ 桑 
吉 轮 沉没 海域 开展 应 急 测绘 调查 ,确认 * 桑 吉 轮 ?沉没 的 准确 位 置 和 附近 海域 地 形 等 
情况 。 

4) 航空 航天 机 器 人 

空间 机 器 人 是 一 种 低 价 位 的 轻型 遥控 机 器 人 ,可 在 行星 的 大 气 环境 中 导航 及 飞行 。 
为 此 , 它 必须 克服 许多 困难 ,例如 , 它 要 能 在 一 个 不 断 变化 的 三 维 环境 中 运动 并 自主 导航 ; 
几乎 不 能 够 停留 ;必须 能 实时 确定 它 在 空间 的 位 置 及 状态 ;要 能 对 它 的 垂直 运动 进行 控 
制 ;要 为 它 的 飞行 预测 及 规划 路 径 。 

太空 机 器 人 泛 指 在 地 外 空间 进行 探索 的 机 器 人 。 例 如 ,美国 NASA 探索 火星 使 用 的 
“机 遇 号 “勇气 号 ”机 器 人 和 较 近 的 “好 奇 号 ”机 器 人 。 它 们 在 火星 表面 进行 移动 探测 , 收 
集 了 大 量 关 于 火星 土壤 和 大 气 等 环境 的 数据 ,为 人 类 了 解 火星 做 出 了 贡献 。 中 国 在 2013 
年 12 月 2 日 发 射 了 探索 月 球 的 嫦娥 三 号 探测 器 和 玉 免 号 巡视 器 。 其 中 ,嫦娥 三 号 探测 器 
为 着 陆 器 ,实施 原 地 探测 ; 玉 免 号 为 移动 探测 器 ,能 对 月 表 进 行 巡视 探测 。 这 两 个 机 器 人 
对 月 球 的 探测 为 人 类 对 月 球 的 理解 增添 了 更 加 丰富 的 数据 。 这 类 在 外 星 表面 实施 移动 探 
测 的 机 器 人 面 对 外 是 未 知 的 环境 ,需要 多 种 感知 技术 形成 综合 的 环境 模型 ,以 支持 机 器 人 
的 安全 保障 。 同 时 ,为 了 提高 利用 机 器 人 获得 科学 数据 的 效益 ,考虑 周全 的 机 器 人 行为 规 
划 方 法 也 是 关键 。 相 比 于 早期 基于 纯 人 工 的 规划 方法 ,目前 的 技术 趋势 为 人 一 机 结合 的 
半自动 规划 方法 (mixed-initiative planning)。 对 于 某 些 基本 的 任务 ,甚至 采用 了 自动 规 
划 的 方法 实现 机 器 人 的 自主 性 。 

2. 工业 机 器 人 

工业 机 器 人 是 指 在 工业 中 应 用 的 一 种 能 进行 自动 控制 的 .可 重复 编程 的 .多 功能 的 、 
多 自由 度 的 、 多 用 途 的 操作 机 ,能 搬运 材料 .工件 或 操持 工具 ,用 以 完成 各 种 作业 , 且 这 种 
操作 机 可 以 固定 在 一 个 地 方 ,也 可 以 在 往复 运动 的 小 车 上 。 

3. 服务 机 器 人 

服务 机 器 人 的 应 用 范围 很 广 ,主要 从 事 维护 、 人 保养. 修理、 运输、 清洗、 保安 .救援 .监护 
等 工作 。 德 国生 产 技术 与 自动 化 研究 所 所 长 施 拉夫 特 博士 给 服务 机 器 人 下 了 这 样 一 个 定 
义 : 服务 机 器 人 是 一 种 可 自由 编程 的 移动 装置 , 它 至 少 应 有 三 个 运动 轴 , 可 以 部 分 地 或 全 
自动 地 完成 服务 工作 。 这 里 的 服务 工作 指 的 不 是 为 工业 生产 物品 而 从 事 的 服务 活动 ,而 
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是 指 为 人 和 单位 完成 的 服务 工作 。 

英国 研制 出 一 款 智 能 聊天 语言 系统 ,可 以 赋予 计算 机 类 似 人 类 的 “思维 ”"。 该 计算 机 
系统 能 够 让 测试 者 无 法 辨识 究竟 是 计算 机 ,还 是 人 类 。 

未 来 的 "伴侣 型 机 器 人 ?是 具有 一 定 感知 ,交流 和 情感 表达 能 力 的 仿真 机 器 人 ,为 人 类 
(特别 是 小 孩 和 老人 ) 提 供 无 微 不 至 的 服务 。 其 特点 ; 一 是 依靠 先进 的 人 工 智 能 技术 ,使 
机 器 人 初步 具有 像 人 一 样 的 感知 、 交 流 和 情感 表达 能 力 ; 二 是 开发 出 制造 机 器 人 的 新 材 
料 ,可 以 让 机 器 人 看 起 来 、 摸 起 来 像 真 人 一 样 。 

娱乐 机 器 人 以 供 人 观赏 、 娱 乐 为 目的 ,具有 机 器 人 的 外 部 特征 ,可 以 像 人 、 像 某 种 动 
物 、 像 童话 或 科幻 小 说 中 的 人 物 等 ,同时 具有 机 器 人 的 功能 ,可 以 行走 或 完成 动作 ,可 以 有 
语言 能 力 、 会 唱歌 有 一 定 的 感知 能 力 。 

医疗 机 器 人 从 功能 上 可 分 为 5 种 类 型 : 一 是 辅助 内 罕 镜 操作 机 器 人 ,这 种 机 器 人 能 
够 按照 医生 的 控制 指令 操作 内 罕 镜 的 移动 和 定位 ;二 是 辅助 微 创 外 科 手术 机 器 人 ,一 般 具 
有 先进 的 成 像 设 备 .一 个 控制 台 和 多 只 电子 机 械 手 ,手术 医生 只 要 坐 在 控制 台 前 观察 高 清 
晰 度 的 三 维 图 像 ,操纵 仪器 的 手柄 ,机 器 人 就 会 实时 完成 手术 ;三 是 远程 操作 外 科 手 术 机 
器 人 ,由 于 配备 了 专门 的 通信 网 络 传输 数据 收发 系统 ,这 种 机 器 人 可 以 完成 远程 手术 ;四 
是 虚拟 手术 机 器 人 ,这 种 机 器 人 将 扫描 的 图 像 资 料 进行 三 维 分 析 后 ,在 计算 机 上 重建 为 人 
体 或 人 体 器 官 , 医 生 便 可 以 在 虚拟 图 像 上 进行 手术 训练 ,制订 手术 计划 ;五 是 微型 机 器 人 ， 
主要 包括 智能 药丸 、 智 能 影像 胶 赛 和 纳米 机 器 人 。 智 能 药丸 机 器 人 能 够 按照 预定 程序 释 
放 药物 并 反馈 信息 ;智能 影像 胶 宫 能 辅助 内 罕 镜 或 影像 检查 ;正在 研制 开发 的 纳米 微型 机 
器 人 还 可 以 钼 入 人 体 , 甚 至 在 肉眼 看 不 见 的 微观 世界 里 完成 靶 向 治疗 任务 。 


10.4.2 机 器 人 发 展 展 望 


当前 ,我 国 机 器 人 市 场 进入 高 速 发 展期 ,2017 年 市 场 规模 约 62. 8 亿美 元 ,2012 一 
2017 年 平均 增长 率 达 到 28%。 其 中 ,工业 机 器 人 连续 五 年 成 为 全 球 第 一 大 应 用 市 场 , 服 
务 机 器 人 需求 潜力 巨大 ,特种 机 器 人 应 用 场景 显著 扩展 ,核心 零 部 件 国产 化 进程 不 断 加 
快 ,创新 型 企业 大 量 涌现 ,部 分 技术 已 可 形成 规模 化 产品 ,并 在 某 些 领 域 具 有 明显 优势 。 
2017 年 ,工业 机 器 人 是 机 器 人 市 场 的 主要 产品 ,所 占 整体 比重 高 达 67. 2% ,市 场 规模 为 
42. 2 亿美 元 。 此 外 ,得 益 于 互联 网 巨头 对 机 器 人 在 服务 场景 应 用 的 投入 ,服务 机 器 人 所 
占 比重 也 超过 20% ,市 场 规模 达到 13. 2 亿美 元 。 

机 器 人 技术 与 产业 的 发 展 呈 现 出 以 下 几 方 面 的 趋势 。 

1. 工业 机 器 人 需求 的 持续 增长 ,机 器 人 密度 增加 

机 器 人 密度 是 指 在 制造 业 中 每 万 名 雇员 占有 的 工业 机 器 人 的 数量 。 另 一 种 衡量 机 器 
人 密度 的 方法 是 ,在 汽车 制造 业 中 每 万 名 生产 工人 占有 机 器 人 的 数量 。 日 本 和 韩国 机 器 
人 密度 相当 高 ,其 中 日 本 汽车 工业 中 的 机 器 人 密度 处 于 世界 领先 地 位 , 紧 接 着 是 美国 、 意 
大 利 、 德 国法 国 、 英 国 \ 西 班 牙 和 瑞典 。 随 着 工业 界 对 精密 加 工 和 高 端 制造 的 需求 ,机 器 
人 的 密度 将 进一步 增加 。 

我 国 工业 机 器 人 市 场 发 展 较 快 , 约 占 全 球 市 场 份额 的 三 分 之 一 ,是 全 球 第 一 大 工业 机 
器 人 应 用 市 场 。2016 年 ,我 国 工业 机 器 人 保持 高 速 增长 ,销量 同比 增长 31. 3%。 按 照应 
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用 类 型 分 ,目前 国内 市 场 的 搬运 上 下 料 机 器 人 占 比 最 高 ,达到 61% ;其 次 是 装配 机 器 人 ， 
占 比 15%, 高 于 焊接 机 器 人 占 比 6 个 百分点 。 当 前 ,我 国生 产 制造 智能 化 改造 升级 的 需 
求 日 益 凸 显 , 工 业 机 器 人 的 市 场 需求 依然 旺盛 ,2017 年 我 国 工业 机 器 人 销量 首次 超过 11 
万 台 ,市 场 规 模 达 到 42. 2 亿美 元 。 预 测 . 到 2023 年 ,国内 市 场 规模 将 翻 一 番 ,进一步 扩大 
到 接近 80 亿美 元 。 

2. 应 用 范围 遍及 工业 、 科 技 和 国防 的 各 个 领域 

在 日 本 ,工业 机 器 人 应 用 得 最 多 的 工业 部 门 依次 是 家 用 电器 制造 、 汽 车 制造 ,塑料 成 
型 .通用 机 械 制 造 和 金属 加 工 等 工业 。 其 中 ,汽车 和 电器 制造 工业 用 的 机 器 人 占 一 半 以 
上 。 在 美国 ,制造 工业 中 的 焊接 装配 搬运 . 装 印 铸造 和 材料 加 工 使 用 的 机 器 人 占 多 数 ; 
其 次 为 喷漆 和 精 整 用 机 器 人 ,并 逐渐 向 纤维 、 食 品 、 电 子 和 家 用 产品 等 工业 部 门 扩 展 。 在 
俄罗斯 ,机 器 人 的 应 用 范围 包括 钟表 和 汽车 零件 的 组 装 、 原 子 能 电站 的 维护 、 锻 压 加 工 、 水 
下 作业 、 装 印 作 业 , 以 及 对 人 体 有 害 物质 的 化 学 处 理 等 。 在 全 面 调查 的 基础 上 ,日 本 工业 
机 器 人 协会 曾 公 布 了 233 个 应 用 机 器 人 的 新 领域 ,其 中 ,涉及 农林 水 产 、 土 木 建筑 .运输 、 
矿山 、 通 信 、 煤 气 、 自 来 水 、 原 子 能 发 电 、 宇 宙 开 发 、 医 疗 福利 以 及 服务 等 行业 。 此 外 ,还 有 
许多 军用 、 办 公 室 用 和 家 用 机 器 人 正在 应 用 着 。 同 时 ,对 空间 机 器 人 、 水 下 机 器 人 和 军用 
机 器 人 的 开发 与 应 用 ,也 令 人 关注 。 

3. 服务 机 器 人 发 展 方兴未艾 

服务 机 器 人 是 一 种 半 自 主 或 全 自主 工作 的 机 器 人 , 它 完 成 的 是 有 益 于 人 类 的 各 种 服 
务 ( 但 不 包括 生产 ) 工 作 。 此 类 机 器 人 包括 保洁 机 器 人 (地 板 清洁 、 油 饶 清 洁 、 氛 窗 氛 墙 \ 飞 
机 清洗 、 游 泳池 清洁 等 )、 家 用 机 器 人 (真空 吸 尘 、 制 草 )、 医 用 机 器 人 (外 科 手 术 、 辅 助 外 科 
手术 ) ,残疾 人 用 机 器 人 (辅助 机 器 人 ,轮椅 机 器 人 )、 送 信和 机器人、 监视 机 器 人 ,保安 机 器 
人 、 导 引 机 器 人 、 加 油 机 器 人 、 消 防 及 爆炸 物 清理 机 器 人 等 。 

各 种 用 途 的 服务 机 器 人 虽然 有 的 尚 处 于 开发 阶段 ,有 的 还 处 于 普及 的 早期 阶段 ,但 已 
显现 对 人 们 生活 质量 提高 的 重要 性 ,呈现 强劲 的 发 展 势 头 。 根 据 牛津 大 学 的 研究 ,以 下 工 
种 最 容易 被 服务 机 器 人 替代 : 电话 促销 员 、 地 产 审核 员 、 摘 录 者 和 搜索 者 (title 
examiners，abstractor and searchers) ,手工 缝 纪 工 ,算术 技师 (mathematical technician)、 
保险 业者 钟表 修 理工 、 货 物 和 货运 代理 ,报税 人 ,摄影 加 工 员 和 处 理 机 器 操作 员 、 开 户 账 
务 员 、 图 书馆 技术 人 员 数据 录入 员 、 计 时 设备 装配 工 和 调节 员 . 保 险 索 赔 和 保单 处 理 职 
员 ,经 纪 人 ,订货 登 记 员 (order clerks) 信贷 员 ,保险 鉴定 人 (汽车 受 损 )、 仲 裁 人 、 裁 判 和 
其 他 的 体育 工作 人 员 。 

我 国 智能 服务 机 器 人 覆盖 的 国内 用 户 总 数 已 经 超过 2 亿 , 并 且 在 诸如 电信 和 运营 商 、 金 
融 服 务 .电子 政务 .电子 商务 .各 类 智能 终端 及 个 人 互联 网 信息 服务 等 领域 提供 了 自动 客 
服 、 智 能 营销 内 容 导航 、 智 能 语音 控制 .娱乐 聊天 等 多 种 类 型 的 服务 。 

我 国 服务 机 器 人 的 市 场 规模 快速 扩大 ,成 为 机 器 人 市 场 应 用 中 颇具 亮点 的 领域 。 
2016 年 ,我 国 服务 机 器 人 市 场 规模 达到 10. 3 亿美 元 ;2017 年 我 国 服务 机 器 人 市 场 规模 达 
到 13. 2 亿美 元 ,同比 增长 约 28% ,高 于 全 球 服务 机 器 人 市 场 年 均 增 速 。 其 中 ,我 国家 用 
服务 机 器 人 、 医 疗 服务 机 器 人 和 公共 服务 机 器 人 市 场 规模 分 别 为 5. 3 亿美 元 .4. 1 亿美 元 
和 3. 8 亿美 元 ,家 用 服务 机 器 人 市 场 增 速 相对 领先 。 

截至 2017 年 年 底 , 我 国 60 岁 以 上 人 口 已 达 2.41 亿 人 , 占 总 人 口 的 17.3%。 老 龄 化 
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社会 服务 .医疗 康复 .救灾 救援 .公共 安全 教育 娱乐 .重大 科学 研究 等 领域 对 服务 机 器 人 
的 需求 也 呈现 出 快速 发 展 的 趋势 。 

根据 (机 器 人 产业 发 展 规划 (2016 一 2020 年 )》, 到 2020 年 我 国 服务 机 器 人 年 销售 收 
入 将 超过 300 亿 元 ,在 助 老 助残 医疗 康复 等 领域 实现 小 批量 生产 及 应 用 。 

4. 机 器 人 向 智能 化 方向 发 展 

随 着 工业 机 器 人 数量 的 快速 增长 和 工业 生产 的 发 展 , 对 机 器 人 的 工作 能 力也 提出 更 
高 的 要 求 ,特别 是 需要 各 种 具有 不 同 程度 智能 的 机 器 人 和 特种 机 器 人 。 这 种 对 智能 化 的 
需求 主要 体现 在 : 

(1) 随 着 集成 化 、 系 统 化 生产 需求 的 不 断 增强 ,人 工 神 经 网 络 技 术 、 模 糊 控 制 技术 以 
及 基于 PC 的 开放 式 控制 系统 将 在 对 车 间 级 机 器 人 的 控制 中 获得 更 多 的 应 用 ,这 种 趋势 
在 国内 外 举办 的 各 类 机 器 人 展会 和 对 抗 赛 中 已 经 有 了 明显 的 体现 。 

(2) 为 了 满足 极限 作业 、 多 作业 对 象 、 大 作业 对 象 以 及 长 距离 搬运 作业 对 于 机 器 人 的 
需求 ,世界 各 国都 在 积极 开展 对 机 器 人 智能 化 移动 (如 自动 飞行 .跳跃 . 息 行 ,行走 、 深 动 和 
滑动 ) 的 研究 。 美 国 宇 航 局 位 于 加 利 福 尼 亚 州 实验 室 的 研究 人 员 表 示 ,他们 已 经 能 够 使 机 
器 人 在 火星 模拟 环境 中 完成 搬运 重 物 以 及 一 些 简单 的 施工 。 这 意味 着 人 类 的 火星 之 旅 将 
由 这 些 机 器 人 迈 出 那 * 一 小 步 ”。 

(3) 由 于 机 器 人 的 工作 环境 大 多 存在 着 许多 不 可 预见 的 不 稳定 因素 ,因此 想 要 实现 
其 智能 化 ,首先 要 确保 机 器 人 安全 可 靠 , 需 要 其 具有 对 外 界 各 种 情况 的 应 变 能 力 以 及 对 自 
身 软 件 的 智能 升级 和 智能 诊断 、 修 复 。 

(4) 随 着 新 的 科技 技术 的 出 现 , 机 器 人 智能 化 将 存在 新 的 实现 途径 。 多 种 新 技术 的 
组 合 将 开发 出 智能 特性 更 加 丰富 的 机 器 人 产品 。 

5. 机 器 人 向 微型 化 方向 发 展 

随 着 技术 的 不 断 进 步 , 微 型 化 成 为 机 器 人 发 展 的 另 一 个 重要 方向 ,毫米 级 ,甚至 是 纳 
米 级 的 机 器 人 将 会 广泛 应 用 于 医学 、 微 加 工 \ 海 洋 和 宇宙 开发 等 领域 。 微 型 化 的 机 器 人 能 
够 适应 管道 建筑 废墟 等 复杂 环境 ,并 在 其 中 自由 移动 。 如 果 能 对 其 运动 进行 更 加 精确 的 
控制 ,还 能 将 其 应 用 到 化 工 及 核 工业 的 管道 以 及 人 体 器 官 中 进行 移动 和 作业 。 例 如 ,在 
2011 年 发 生 的 日 本 福 岛 核 泄 漏 中 ,第 3 号 核反应 堆 的 建筑 物 内 的 核 辐射 量 很 高 ,每 小 时 
的 核 辐射 量 达到 50 一 150 微 西 弗 ,工作 人 员 无 法 入 内 进行 设备 抢修 等 工作 ,通过 高 辐射 专 
用 的 Monirobo 机 器 人 ,能 够 在 每 小 时 减少 10 一 20 微 西 弗 的 辐射 量 。 

6. 机 器 人 的 军用 化 方向 快速 发 展 

随 着 国际 政治 和 地 缘 政治 的 变化 ,各 国 对 军事 力量 产生 了 新 的 需求 ,如 利用 机 器 人 实 
现 陆 海 、 空 .天 协同 作战 ;利用 机 器 人 实现 非 对 称 作战 .灵活 多 变 战术 ,一 方面 要 求 机 器 人 
微型 化 ,以 便 适 合 于 单 兵 使 用 , 另 一 方面 则 要 求 机 器 人 大 型 化 .以便 能 携带 足够 多 的 任务 
载荷 ,适应 多 种 战术 需要 。 

这 些 需求 要 求 机 器 人 出 现在 军事 战场 的 各 个 角落 . 既 能 独立 执行 任务 ,又 能 协同 进行 
作战 ,同时 还 要 保证 有 足够 的 自主 能 力 、 足 够 的 可 靠 性 和 足够 的 抗 毁 性 。 综 合 起 来 说 , 随 
着 计算 机 芯片 的 不 断 更 新 ,计算 机 的 信息 存储 密度 已 超过 人 脑 神经 细胞 的 密度 ,军用 机 器 
人 将 会 有 较 高 的 智能 优势 。 此 外 ,先进 技术 在 机 械 系统 、 传 感 器 .处 理 器 控制 系统 上 的 大 
量 应 用 将 使 军用 机 器 人 具备 在 接 到 指令 后 迅速 做 出 反应 ,并 自主 地 完成 作战 任务 的 能 力 。 
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未 来 战场 既是 力 的 较量 ,更 是 谋 的 比拼 。 目 前 ,机 器 人 的 军备 竞赛 已 悄然 展开 。 据 统 
计 , 目 前 全 球 超 过 60 个 国家 的 军队 已 装备 了 军用 机 器 人 ,种 类 超过 150 种 。 预 计 到 2040 
年 ,美军 可 能 会 有 一 半 的 成 员 是 机 器 人 。 除 美国 以 外 , 俄 、 英 、 德 .日 . 韩 等 已 相继 推出 各 自 
的 机 器 人 战士 。 在 不 久 的 将 来 ,还 会 有 更 多 的 国家 投入 到 这 场 无 人 化 战争 的 研制 与 开 
发 中 。 

2013 年 3 月 ,美国 发 布 新 版 4 机 器 人 技术 路 线 图 : 从 互联 网 到 机 器 人 ,阐述 了 包括 军 
用 机 器 人 在 内 的 机 器 人 发 展 路 线 图 ,决定 将 巨额 军备 研究 费 投向 军用 机 器 人 研制 ,使 美军 
无 人 作战 装备 的 比例 增加 至 武器 总 数 的 30% ,未 来 三 分 之 一 的 地 面 作战 行动 将 由 军用 机 
器 人 承担 。 

集群 智能 是 未 来 无 人 化 作战 的 突破 口 。 美 国 国防 部 发 布 的 (无 人 机 系统 路 线 图 
2005 一 2030) 将 无 人 机 自主 控制 等 级 分 为 1 一 10 级 ,确立 “全 自主 集群 "是 无 人 机 自主 控制 
的 最 高 等 级 ,预计 2025 年 后 ,无 人 机 将 具备 全 自主 集群 能 力 。 

俄罗斯 科研 人 员 正 在 研发 一 种 被 称 为 “杀手 机 器 人 ”的 人 形 智能 武器 ,可 不 借助 人 类 
干预 ,自主 选择 并 攻击 目标 ,并 能 帮助 遭 到 袭击 的 受伤 士兵 撤离 。 俄 军 已 宣布 将 在 每 个 军 
区 和 舰队 中 组 建 独立 的 军用 机 器 人 连 ,到 2025 年 ,机 器 人 装备 将 占 整个 武器 和 军事 技术 
装备 的 30% 以 上 。 

7. 美国 “国家 机 器 人 计划 2.0” 

美国 “国家 机 器 人 计划 2.0”(NRI-2.0) 项 目 拟 支持 四 个 主要 研究 方向 ,重点 研制 通用 
协作 机 器 人 (co-robots)。NRI-2.0 项 目 建立 在 原 国家 机 器 人 计划 CNRI) 的 基础 之 上 , 支 
持 美国 基础 研究 , 它 将 加 速 开发 和 使 用 与 人 类 一 起 工作 或 合作 的 协作 机 器 人 。NRI-2.0 
项 目 聚 焦 于 在 方方面面 与 协作 机 器 人 无 缝 集成 ,协助 人 类 生活 的 各 个 方面 。 

面 对 机 器 人 需求 的 不 断 增长 和 扩大 ,我 国 机 器 人 的 研发 制造 还 存在 较 大 的 差距 ,有 待 
在 多 个 方向 做 出 努力 。 主 要 的 努力 方向 如 下 。 

(1) 基础 理论 研究 。 包 括 机 器 人 的 设计 与 控制 等 方面 的 理论 、 方 法 、 算 法 与 技术 , 涉 
及 机 器 人 的 机 构 设 计 、 运 动 学 分 析 、 动 力学 控制 ,多 传感器 感知 与 信息 融合 、 机 器 人 视觉 、 
多 机 器 人 通信 与 协作 、 运 用 人 工 智 能 方法 的 机 器 人 控制 等 若干 基础 理论 问题 。 

(2) 机 器 人 新 材料 的 研究 。 新 型 材料 的 成 功 研制 可 使 机 器 人 在 物理 上 具有 更 好 的 特 
性 ,如 使 机 器 人 重量 更 轻 , 使 机 器 人 更 加 柔韧, 使 机 器 人 更 加 坚硬 ,使 机 器 人 更 加 微型 化 。 

(3) 电子 元 器 件 的 研究 。 涉 及 驱动 器 (如 伺服 电动 机 )、 控 制 器 、 传 动 部 件 、 传 感 器 等 
器 件 的 研究 与 精密 加 工 技术 。 这 些 元 器 件 的 改进 与 创新 将 对 机 器 人 工作 时 的 稳定 性 、 作 
业 精 度 和 持续 工作 能 力 提供 重要 的 技术 支撑 。 

针对 以 上 问题 ,我 国政 府 ` 企 业 和 研究 机 构 已 经 开展 了 一 些 重要 的 规划 ,包括 通过 政 
府 政策 引导 机 器 人 关键 部 件 产业 的 较 快 发 展 ,鼓励 传统 机 器 人 企业 的 技术 创新 ,鼓励 民企 
参与 机 器 人 产业 发 展 ,鼓励 企业 挖掘 工业 领域 的 新 需求 并 开发 新 型 机 器 人 ,推进 服务 型 机 
器 人 在 玩具 、 娱 乐 、 家 用 、 护 理 、 医 疗 、 康 复 、 建 筑 、 农 业 和 食品 加 工 等 市 场 的 推广 与 运用 。 
随 着 这 些 规 划 的 执行 和 市 场 需求 的 引导 ,我 国 机 器 人 行业 将 迎 来 机 器 人 产品 技术 和 机 器 
人 研发 人 才 的 快速 发 展 。 
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10.5 案例 分 析 : 仿真 机 器 人 运动 控制 算法 


国际 机 器 人 足球 联盟 (Federation of International Robot-soccer Association ,FIRA) 
于 1997 年 成 立 后 ,在 全 世界 每 年 举办 一 次 机 器 人 世界 杯 比赛 (FIRA Cup) ,其 中 的 一 个 比 
赛 项 目 为 5 对 5 仿真 比赛 (Middle League Simurosot，MLS) 。 在 仿真 比赛 中 ,所 有 的 硬 
件 设备 均 由 计算 机 模拟 实现 ,简化 了 比赛 系统 的 复杂 度 ,减少 了 硬件 需求 ,可 控 性 好 、 无 破 












坏 性 、 可 重复 使 用 ,不 受 硬 件 条 件 和 场地 环境 的 限制 。 开 发 此 类 比赛 的 竞赛 程序 既 能 锻炼 
程 2 力 ,又 能 锻炼 智能 控制 算法 设计 能 力 。 请 阅读 下 面 的 材料 ,开发 自己 的 竞赛 程 


序 并 与 其 他 程序 进行 比较 。 

MLS 竞赛 的 软件 平台 说 明 网 页 链接 为 http://www. fira. net/contents/sub03/ 
sub03_7. asp, 下 载 该 平台 的 链接 为 http://www. fira. net/contents/data/ Middle_League 
_SimuroSot_Program. exe, 比 赛 规则 的 英文 说 明文 档 见 http://www. fira. net/contents/ 
data/ Middle_League_SimuroSot. pdf 。 

为 完成 本 练习 ,首先 下 载 # 

下 面 从 7 个 方面 介绍 在 MLS 比赛 中 控制 机 器 人 控制 策略 的 设计 。 


装 Middle_League_SimuroSot_Program. exe。 





10. 5.1 仿真 平台 使 用 介绍 


在 每 场 比赛 中 ,参赛 双方 分 别 选 择 不 同 颜色 的 比赛 队伍 。 在 本 例 中 ,乙方 选择 蓝 队 ， 
甲 方 (武汉 工程 大 学 ) 选 择 黄 队 。 

每 个 队伍 执行 自己 开发 的 控制 策略 程序 的 过 程 如 下 。 

将 自己 编写 的 策略 文件 编译 成 dll, 黄 队 程序 复制 到 C:\strategy\yellow 目录 下 , 蓝 
队 程 序 复制 到 C:Nstrategy\blue 目录 。 在 仿真 平台 中 单 击 Strategy 按钮 ,选择 “C++ ”, 然 
后 输入 策略 文件 名 , 单 击 send 按钮 。 选 择 相 应 的 比赛 模式 ,按照 规则 使 用 鼠标 选中 和 拖 
忠 的 方式 氛 放 好 球 和 球员 的 位 置 ,随后 单 击 start 按钮 开始 比赛 。 

MLS 平 台 的 运行 界面 如 图 10-2 所 示 。 











酌 smartslts 
Free Ball 
Place Kick 
Penalt 
Free Kick 
Goal Wick 
Yellow Ball 
Be Ball 

栈 SmRT 


TINE = 000 
SCORE O 


© TIMESCONE 
NEW GAME 
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图 10-2 MLS 平台 的 运行 界面 ( 左 侧 场地 为 我 方 , 右 侧 场地 为 对 方 ) 
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MLS 的 主 菜单 及 其 说 明 如 图 10-3 所 示 。 


| STRATEGIES 


Free on 人 A 一 各 队 载 入 匡 略 
Pema B 一 选择 以 何 种 方式 开 球 ， 依 次 为 ( 自 
et 由 球 、 开 球 、 点 球 、 任 意味 、 球 门 球 ) 
Eee C- 选择 开 球 方 

DD 一 开始 比赛 

E 一 比赛 对 间 和 比分 
= FF 一 修改 对 间 和 比分 


GG 一 开始 一 场 新 的 比赛 
H 一 平台 帮助 以 及 规则 


Ey TIME/SCORE 








图 10-3 MLS 的 主 菜单 及 其 说 明 





4 及 其 说 明 如 图 10-4 所 示 


人 A 一 选择 使 用 何 种 开发 语言 


(Lingo/C++) 
B 一 输入 益 队 程序 的 文件 名 
Yellow Lingo C 一 输入 黄 队 程序 的 文件 名 


Send 


0penyViewer 


DD 一 将 各 队 程 序 载 入 平台 


E 一 打开 状态 查看 窗口 
(显示 了 球 和 机 器 人 的 一 
些 基本 信息 ) 








图 10-4 MLS 的 策略 载 入 菜单 及 其 说 明 


MLS 的 比赛 控制 菜单 及 其 说 明 如 图 10-5 所 示 。 


REPLAY > | PAUSE ASTOP 四 | 





A 一 立即 回放 B 一 暂停 C- 结束 比赛 
图 10-5 MLS 的 比赛 控制 菜单 及 其 说 明 


MLS 的 回放 控制 菜单 及 其 说 明 如 图 10-6 所 示 。 


p> |<<\p NORM> P| EXITREPLAY WB NOGOAL 





A 一 重头 开始 回放 ”B 一 从 前 300 个 周期 开始 回放 
C- 一 般 速 度 回放 ”DD 一 慢 速 度 回放 一 逐 帧 回放 
F 一 推出 回放 模式 。 口 一 当前 进 球 无 效 

图 10-6 MLS 的 回放 控制 莱 单 及 其 说 明 
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MLS 中 机 器 人 的 编号 与 说 明 如 图 10-7 所 示 。 


home 代 表 
己方 机 器 人 homel. home3 

2— Ls -2 

opp 代表 ppp 

对 方 机 村 人 由 homeo 
箭头 所 指 的 
方向 为 机 可 home2 home4 

FZ— F— be 
A 前 的 正 全 





图 10-7 MLS 中 机 器 人 的 编号 与 说 明 


MLS 场地 顶点 的 坐标 说 明 如 图 10-8 所 示 。 


(6.8118, 77.2392) (93.4259, 77.2392) 


(6.8118, 6.3730) (93.4259, 6.3730) 





(0.0) 说 明 : 1 英寸 =2.54 厘 米 


图 10-8 MLS 场地 顶点 的 坐标 说 明 


MLS 场地 的 各 种 标志 及 尺寸 说 明 如 图 10-9 所 示 。 

关于 鼠标 和 键盘 的 操作 : 在 比赛 开始 前 或 比赛 暂停 时 ,可 以 用 鼠标 拖 动 球 或 机 器 人 
到 场地 的 任何 位 置 。 在 比赛 开始 前 或 比赛 暂停 时 , 当 鼠 标 单 击 某 一 个 机 器 人 后 ,可 以 用 键 
盘 的 -二 或 二 - 键 调整 该 机 器 人 的 角度 

MLS 平台 的 特点 : 机 器 人 动力 学 特 征 及 碰撞 仿真 极为 真实 (该 平台 采用 商用 游戏 引 
擎 公司 Havok 的 物理 引擎 ,该 引擎 被 帝国 时 代 、CS 等 游戏 采用 ) ,该 平台 实现 了 2. 5 维 界 
面 ,采用 Director 设计 界面 ,3D Max 建 模 。 

平台 对 操作 系统 的 需求 。 硬 件 需求 : Pentium 看 600 MHz 或 以 上 性 能 的 CPU， 
256MB 系统 内 存 , 具 有 32MB 以 上 显存 的 TNT2 或 其 以 上 级 别 的 显示 卡 ,能 够 支持 800 
像素 X600 像素 以 上 分 辩 率 的 显示 器 ;软件 需求 : Windows 98 或 以 上 版 本 的 操作 系统 ， 
DirectX 8. 0 或 以 上 版 本 。 竞 赛程 序 的 开发 环境 建议 使 用 Microsoft Visual C++ 6. 0 或 
Microsoft Visual C++ 2005/2008 。 
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图 10-9 MLS 场地 的 各 种 标志 及 尺寸 说 明 ( 单 位 : cm) 


10.5.2 仿真 平台 与 策略 程序 的 关系 


策略 程序 就 是 自己 编写 的 能 够 使 仿真 平台 中 机 器 人 按照 预定 方式 运动 的 程序 ,通俗 
来 说 ,就 是 能 够 打 比 赛 的 程序 。 
仿真 平台 与 策略 程序 的 通信 方式 如 图 10-10 所 示 。 


策略 程序 将 接收 的 
数据 进行 处 理 









策略 程序 接收 数据 


策略 程序 发 送 数 据 


MLS 平 台 MLS 策 略 程序 
图 10-10 仿真 平台 与 策略 程序 的 通信 方式 


策略 程序 每 个 周期 接收 来 自 MLS 的 数据 ,该 数据 包括 已 方 \ 对 方 机 器 人 的 坐标 、 角 
度 ( 当 前 周期 ,上 一 周期 )、 球 的 坐标 (当前 周期 ,上 一 周期 )。 


策略 程序 每 个 周期 发 送 的 数据 包括 己方 (home[ 让 ) 每 个 机 器 人 的 左轮 速 (pwm1) 和 
右 轮 速 (pwm2) 。 
10.5.3 策略 程序 的 结构 


下 面 以 甲 方 的 策略 程序 为 例 , 介 绍 策略 程序 的 结构 。 甲 方 比赛 策略 文件 的 组 成 如 


图 10-11 所 示 。 
其 中 ,interface. h 和 interface. cpp 含有 与 仿真 平台 通信 
的 一 个 结构 Environment 和 3 个 函数 。 


struct Environment 


{ 


条 10 竟 如 田 人 学 一 5230 一 一 一 


从 interface.cpp 
interface.h 





// 点 类 型 

struct Vector3D 

{ 图 10-11 甲 方 比赛 策略 
double x, y, 2; 文件 的 组 成 

ys 

// 边 界 类 型 矩形 类 ) 


struct Bounds 
{ 

long left, right, top, bottom; 
a 


// 已 方 机 器 人 类 型 
struct Robot 
{ 

Vector3D pos; 


double rotation; 


// 服 务 器 只 接受 这 两 个 变量 (机 器 人 的 左 、 右 轮 速 ) 
double velocityLeft, velocityRight; 
]7 


// 对 方 机 器 人 类 型 
struct OpponentRobot 
1 
Vector3D pos; 
double rotation; 
}; 


// 球 类 型 
struct Ball 
{ 
Vector3D pos; 
}; 


Robot home[5]; //5 个 己方 机 器 人 
OpponentRobot opponent [5]; //5 个 对 方 机 器 人 
Ball currentBall, lastBall, predictedBall; // 当 前 球 , 上 一 个 周期 的 球 


Bounds fieldBounds, goalBounds; // 场 地 边界 ,球门 边界 
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long gameState; 

long whosBall; 
bs; 
void Create ( Environment &env ); 
void Destroy ( Environment genv ); 


void Strategy ( Environment &env ); 


// 比 赛 状 态 
// 踢 球 方 


// 比 赛 开始 时 系统 调用 一 次 

// 比 赛 结束 时 系统 调用 一 次 

// 比 赛 过 程 中 由 系统 按 周期 调用 (比赛 策略 都 放 在 
其 中 ) 


甲 方 设计 的 General. h 文件 定义 的 类 型 和 函数 有 : 


// 球 类 型 

class Ball 

i 

public: 
double x; 
double y; 

Bs 

// 已 方 机 器 人 类 型 

class HRobot 

* 

public: 
double x; 
double y; 
double angle; 
double pwml; 
double pwm2; 

]7 

// 对 方 机 器 人 类 型 

class ORobot 

有 

Public: 
double x; 
double y; 
double angle; 

}; 

// 场 地 类 型 

class Field 

上 

public: 


// 构 造 函 数 ,初始 化 场地 各 点 坐标 


// 球 的 x 坐标 
// 球 的 y 坐标 


// 机 器 人 的 x 坐标 

// 机 器 人 的 y 坐标 

// 机 器 人 的 角度 

// 机 器 人 的 左轮 速 ( 左 推进 力 数值 ) 
// 机 器 人 的 右 轮 速 ( 右 推进 力 数值 ) 


// 机 器 人 的 x 坐标 
// 机 器 人 的 Y 坐 标 
// 机 器 人 的 角度 


Field() :left (FLEFTX) ，top (FTOP) right (FRIGHTX), 
bottom (FBOT), gtop (GTOPY), gbot (GBOTY) {} 


double left; 
double top; 
double right; 


// 场 地 左边 界 
// 场 地 上 边界 
// 场 地 右边 界 
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double bottom; // 场 地 下 边界 
double gtop; // 球 门 上 边界 
double gbot; // 球 门下 边界 

}; 

坐标 转换 函数 : 

// 球 的 坐标 转换 

void Transformcoordinate (Ball sbal1，const Field sfd) 

// 已 方 机 器 人 的 坐标 转换 

void TransformCoordinate (HRobot &robot, const Field sfd) 

// 对 方 机 器 人 的 坐标 转换 

void TransformCoordinate (ORobot &robot, const Field sfd) 


Strategy.h 文件 包含 的 类 型 定义 和 函数 定义 如 下 。 
// 策 略 类 


class Strategys 
{ 
public: 
// 球 的 信息 
Ball ball, lastBall; 
// 已 方 机 器 人 的 信息 
HRobot home[5], lastHome[5]; 
// 对 方 机 器 人 的 信息 
ORobot opponent[5], lastOpponent [5]; 
Field fd; // 场 地 信息 
// 本 策略 属于 哪个 队 ( 黄 队 或 者 蓝 队 ) 
bool ourside; 
int gameCounter; // 计 数 器 (单位 :周期 ) 
// 策 略 类 初始 化 (从 平台 获取 信息 ) 
void initializtion (const Environment& env); 
// 将 每 个 机 器 人 的 轮 速 发 给 服务 器 
void sendDataToServer (Environment& env) const; 
void FreeBall (); // 自 由 球 策略 
void PlaceKick(); // 开 球 策略 
void PenaltyKick(); // 点 球 策略 
void FreeKick(); // 任 意 球 策略 
void GoalKick (); // 球 门 球 策略 
void Normal (); // 一 般 比 赛 策略 
} 


Action. h 定义 的 函数 如 下 。 


void Velocity(HRobot &robot, double pwml, double pwm2) ; // 向 机 器 人 发 轮 速 
void Rotation (HRobot &robot, double desired angle); // 转 到 指定 角 
void Position (HRobot &robot, double x, double y); // 跑 到 定点 

void Goalie (HRobot grobot, const Ball gball, const Field sfd); 


// 守 门 员 执 行 简单 策略 
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10.5.4 动作 函数 及 说 明 


下 面 的 动作 函数 可 以 给 机 器 人 自由 地 发 轮 速 (在 该 程序 中 可 以 简单 地 认为 轮 速 就 是 
机 器 人 的 推进 力 ) 。 

void Velocity(HRobot & robot, double pwml，double pwm2) 

轮 速 值 对 机 器 人 运动 的 影响 如 图 10-12 所 示 。 


左轮 速 pwml ~ 


右 轮 速 pwm2 


pwml>pwm2， 机 器 人 顺 时 针 旋 转 
pwm1l<pwm2， 机 器 人 逆 时 针 旋转 当 轮 速 为 负 时 ， 机 器 人 反 向 运动 


图 10-12 轮 速 值 对 机 器 人 运动 的 影响 
Velocity 函数 的 应 用 示例 如 下 。 


void Strategys: :Normal () 
{ 


Velocity (home [2], 20, 20); // 让 2 号 机 器 人 以 20 的 轮 速 前 进 
Velocity (home[1], -5, -5)7 // 让 1 号 机 器 人 左右 轮子 都 以 -5 的 轮 速 后 退 
Velocity (home [3], 50, 20); // 让 3 号 机 器 人 以 左轮 速 50, 右 轮 速 20 前 进 


} 


void Rotation(HRobot &.robot, double desired_angle); 该 函数 可 以 让 机 器 人 转 到 
指定 的 任意 角度 。 运 用 Rotation 函数 的 示例 如 下 。 


void Strategys: :Normal () 
时 


Rotation] (home [1], 30); // 让 1 号 机 器 人 转 到 30” 
Rotationl (home [2], 60); // 让 2 号 机 器 人 转 到 60” 
Rotation] (home [3], 90); // 让 3 号 机 器 人 转 到 90” 


} 


void Position(HRobot & robot，double x, double y); 该 函数 可 以 让 机 器 人 跑 到 场 
地 上 指定 的 任何 地 点 。Position 的 运用 示例 如 下 。 
void Strategys::Normal () 


{ 
Position (home[2], ball.x, ball.y); ”// 让 2 号 机 器 人 追 着 球 跑 
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double x = (fd.left +fd.right) / 2; 

double y = (fd.bottom +fd.top) / 2; 

Position] (home [4], x, y); // 让 4 号 机 器 人 跑 到 场地 中 心 
} 


上 述 3 个 函数 的 组 合 使 用 示例 如 下 。 


void Strategys: :Normal () 
Lt 


Position] (home [0], fd.left +10, ball.y); // 让 0 号 机 器 人 在 球门 附近 跟着 球 的 
Y 坐 标 跑 

Velocity (home [1], 10, 70); // 让 1 号 机 器 人 逆 时 针 转 圈 

Position] (home [2], ball.x, ball.y); // 让 2 号 机 器 人 追 着 球 跑 

Rotationl (home[3]，- 45); // 让 3 号 机 器 人 转 到 - 45 

Velocity (home [4], 5, 5); // 让 4 号 机 器 人 跑 直 线 


} 

在 运用 以 上 3 个 函数 中 ,需要 注意 : 四 轮 速度 限制 为 一 125 一 125km; @ 平 台 原 始 接 
口中 提供 了 比赛 状态 (GameState) 以 及 控 球 方 (WhosBall) 两 个 参数 ,但 实际 开发 时 发 现 
它们 毫 无 用 处 , 故 需要 自己 判断 当前 的 比赛 状态 ; @ 场 地 度量 单位 为 英寸 (1 英寸 =2. 54 
厘米 ); @ 机 器 人 角度 的 单位 为 角度 (不 是 弧度 ); @ 须 转换 左 、 右 半 场 。 


10.5.5 策略 


甲 方 的 策略 系统 结构 如 图 10-13 所 示 。 

预 处 理 层 的 功能 设计 : 输入 信息 预 处 理 ,包括 对 
接口 参数 进行 英寸 到 厘米 及 坐标 方向 的 转换 ,计算 
个 体 的 线 速度 .角速度 ,个 体 间 的 距离 ,角度 等 。 

协调 层 的 功能 设计 协调 层 是 决策 的 最 高 层 , 它 
接受 经 预 处 理 过 的 比赛 数据 ,包括 机 器 人 和 球 的 位 
团 。 根 据 这 些 数据 判断 场 上 的 形势 ,从 知识 库 中 抽 
取 合适 的 协作 模式 , 定 出 合作 的 意图 ,并 将 意图 传人 
下 一 层 。 协 调 层 的 关键 有 两 点 : 判断 场 上 形势 和 角 
色 的 分 配 。 为 了 对 比赛 场 上 的 形势 进行 分 析 处 理 ， 
需要 把 从 仿真 平台 得 到 的 数据 进行 模糊 化 与 抽象 。 图 10-13 甲 方 的 策略 系统 结构 
化 ,再 根据 一 定 规则 分 配角 色 。 

协调 层 主要 包含 4 个 功能 : 区 域 划分 .判断 控 球 者 、 角 色 分 配 、 队 形 确定 。 

区 域 划分 的 原理 : 一 般 将 球场 分 成 3 个 区 域 : 进攻 区 、 防 守 区 和 过 渡 区 ; @ 进 攻 区 
在 对 方 球门 区 附近 ; @ 防 守 区 在 已 方 球门 区 附近 ; @ 过 滤 区 在 前 两 者 之 间 。 

判断 控 球 者 的 原理 : 判断 哪 方 或 哪 名 队员 控制 球 ,常用 的 方法 有 : 时 间 区 域 控制 法 
和 最 短 距离 法 (在 当前 时 刻 谁 离 球 最 近 便 代 表 谁 控制 球 , 实 现 较为 简单 ) 等 。 

角色 分 配 的 主要 思想 : 球 在 进攻 区 内 , 且 我 方 控制 球 , 则 离 球 近 的 队员 为 主攻 、 另 一 
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名 队员 为 协 攻 ( 守 门 员 的 角色 通常 不 变 ) : 球 在 防守 区 域内 , 则 离 球 近 的 队员 为 主 防 . 另 一 
名 队员 为 协 防 。 角 色 分 配 首先 取决 于 开发 者 设计 的 各 种 攻防 策略 (存放 在 策略 库 中 ) ,如 
全 攻 全 守 、 区 域 防守 、 前 后 场 法 两翼 法 等 。 

队 形 确定 的 思想 : 机 器 人 的 协作 是 通过 队 形 实现 的 ,通过 队 形 将 任务 分 解 为 角色 集 
合 。 队 形 中 包括 与 队 中 足球 机 器 人 个 数 相等 的 角色 。 球 员 由 5 个 队员 组 成 ,所 以 队 形 可 
表示 为 : 二 {rolel ,role2,role3,role4,role5)( 其 中 ,F 表示 队 形 ,rolel 一 role5 为 角色 ) 。 

运动 规划 层 的 功能 设计 : 运动 规划 层 是 将 协作 意图 分 解 细 化 , 它 注重 个 体 机 器 人 要 
完成 什么 动作 。 运 动 规划 层 的 设计 要 求 一 一 规划 生成 速度 要 人 快 ;控制 周期 之 间 规 划 的 衔 
接应 该 连贯 .平滑 。 在 这 一 层 的 内 容 中 ,应 当 考 虑 避 障 处 理 、. 冲 突 检测 与 处 理 .故障 检测 与 
处 理 . 边 墙 检测 与 处 理 . 犯 规 预防 处 理 。 

基本 动作 层 的 功能 设计 : 基本 动作 层 是 决策 的 最 底层 , 它 将 运动 规划 层 产生 的 阶段 
性 目标 和 具体 的 行动 指令 对 应 起 来 ;基本 动作 是 不 可 分 解 的 动作 ,这 些 动作 可 以 离线 设计 
分 别 调试 。 通 过 分 析 和 实验 得 到 一 组 基本 动作 集合 ,然后 通过 调用 集合 的 一 个 或 几 个 基 
本 动作 组 合 形成 复杂 的 动作 。 在 此 层 设计 中 的 基本 动作 主要 包括 射门 (ShootBall) 动 作 
函数 .转角 (Angle) 动作 函数 、 到 定点 (Position) 动作 函数 等 。 

为 了 进行 战术 配合 ,常常 需要 调用 多 个 技术 动作 ,可 以 将 此 类 动作 定义 为 战术 动作 ， 
如 一 传 一 射 (PassShoot) ,二 过 一 (TwoBeatOne)、 交 叉 掩护 (CrossAndCover) 等 ,这 样 便 
由 战术 动作 一 一 技术 动作 一 一 基本 动作 构成 了 动作 安排 模块 的 三 层 结构 。 

下 面 基 于 以 上 思想 介绍 甲 方 设 计 的 具体 决策 。 

预 处 理 层 的 具体 设计 见 表 10-1 。 

表 10-1 预 处 理 层 的 具体 设计 
函 数 作 用 


对 平台 传 来 的 接口 Environment 数据 进行 转换 ,将 对 方 数据 转换 为 厘米 制 ， 
将 坐标 系 由 屏幕 坐标 系 转换 为 笛 卡 儿 坐 标 系 

再 次 对 Environment 数据 进行 对 称 转换 ,包括 对 方 ,己方 球员 的 方位 和 角度 
数据 \ 球 的 方位 数据 ,使 转换 后 的 数据 能 适用 于 我 队 的 策略 





TInitialization() 





TransformCoordinate() 











PredicateBall() 预测 球 在 下 一 时 刻 的 位 置 
c 个 体 的 线 速度 .角速度 ,个 体 间 的 距离 .角度 等 中 间 参 数 ,这 些 参数 由 其 他 
ount() 函数 使 用 





球场 区 域 划分 方案 如 图 10-14 所 示 。 


忆 冰 过 讲 
马 沙 十 洁 











图 10-14 球场 区 域 划分 方案 


务 10 芭 如 吕 人 学 一 旺 29 由 一 一 一 


角色 分 配方 案 : Drolel : 前 锋 角 色 ,在 对 方 球门 区 附近 ; @role2: 前 卫 角 色 , 在 对 方 
半 场 ; Brole3: 中 卫 角 色 , 在 中 场 附 近 ; 图 role4: 后 卫 角 色 , 靠 近 本 方 球门 区 ; @role5: 
守门 员 角 色 。 

队 形 确定 方案 : 根据 队 形 的 定义 及 分 析 可 知 , 在 5VS5 的 比赛 中 可 产生 多 种 队 形 , 常 
见 的 队 形 有 如 下 3 类 。 

(1) 进攻 队 形 : 安排 更 多 足球 机 器 人 充当 前 锋 角 色 对 应 的 队 形 ,如 队 形 1: {rolel， 
rolel ,role2,role4 ,role5) ; 队 形 2( 强 攻 ) : {rolel ,rolel ,rolel ,role2,role5 } 。 

(2) 防守 队 形 : 安排 更 多 足球 机 器 人 充当 后 卫 角 色 对 应 的 队 形 ,如 队 形 3: {role4， 
role4，role3 ,rolel ,role5) ; 队 形 4( 严 密 防守 ) : {role4,roled,role4,rolel,role5 } 。 

(3) 攻防 兼顾 队 形 : 平衡 地 安排 足球 机 器 人 充当 前 锋 角色 和 后 卫 角 色 对 应 的 队 形 。 
攻防 兼顾 队 形 是 一 种 保守 的 队 形 , 如 队 形 5: {rolel ,rolel ,role4,role4,role5)。 

运动 规划 层 的 具体 设计 : 

在 比赛 过 程 中 , 场 上 的 形势 错综复杂 ,瞬息万变 ,球员 及 球 的 位 置 不 断 发 生变 化 ,本 系 
统 设计 出 一 系列 函数 ,用 来 考虑 冲突 检测 与 处 理 .故障 检测 与 处 理 . 边 墙 检测 与 处 理 、 犯 规 
预防 处 理 。 和 运动 规划 层 功能 的 具体 设计 见 表 10-2。 

表 10-2 运动 规划 层 功 能 的 具体 设计 

函 数 作 用 

NearBound() 用 于 球员 在 边界 和 四 个 边 角 附近 的 动作 处 理 


用 于 判断 己方 球员 是 否 陷 人 死角 或 因 对 方 球员 近 身 防守 而 造成 僵局 , 若 发 生 这 些 
情况 ,应 采取 相应 的 补救 措施 


AvoidFoul() 用 于 犯规 判断 ,防止 出 现 己方 球员 主动 犯规 的 情况 


对 球 的 位 置 进行 预测 ,并 对 机 器 人 行进 路 线 中 可 能 出 现 的 障碍 进行 预测 ,以 达到 
提前 准备 并 修改 相应 规划 的 目的 。 若 规划 的 路 径 前 面 有 障碍 物 , 则 考虑 避 障 ,如 
果 目 标的 方向 太 靠近 障碍 物 ,方向 的 调节 是 通过 预 置 的 障碍 物 的 外 围 圆周 切线 。 
由 于 运动 控制 算法 是 连续 运行 ,所 以 避 障 分 析 一 直 不 断 地 重新 规划 无 障碍 路 径 











TroubleJudge() 








PathPlan() 





运动 层 的 具体 功能 设计 : 由 战术 安排 一 一 技术 动作 一 一 基本 动作 构成 动作 安排 模块 
的 三 层 结构 , 见 表 10-3。 
表 10-3 运动 层 的 具体 功能 设计 
构件 名 Action 


射门 (CShootBall) 动 作 函 数 
基本 动作 转角 (Angle) 动 作 函 数 
到 顶点 (Position) 动 作 函 数 


一 传 一 射 (PassShoot) 配 合 函 数 

技术 动作 二 过 一 (TwoBeatOne) 配 合 函 数 
交叉 掩护 (CrossAndCover) 配 合 函 数 
进攻 (Attack) 战 术 函 数 


战术 安排 防守 (Defense) 战 术 函 数 
守门 (GoalKeeper) 战 术 函 数 
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对 我 方 设计 策略 的 说 明 如 下 。 

(1) 通过 预 处 理 层 对 接口 参数 进行 英寸 到 厘米 及 坐标 方向 的 转换 ,计算 个 体 的 线 速 
度 . 角 速度 ,个 体 间 的 距离 .角度 ,调用 initializtion()、TransformCoordinate ()、PredictBal()、 
Count() 函 数 。 

(2) 建立 防止 机 器 人 犯规 .陷入 死角 、 避 障 的 规则 。 

规则 1: 防止 出 现 已 方 球员 主动 犯规 的 情况 ,调用 AvoidFoul() 函 数 。 

规则 2; 判断 己方 球员 是 否 陷 人 死角 或 因 对 方 球员 近 身 防守 而 造成 僵局 , 若 发 生 这 些 
情况 , 则 调用 TroubleJudge() 函 数 。 

规则 3: 当 规 划 的 路 径 前 面 有 障碍 物 时 , 则 考虑 避 障 调用 PathPlan() 机 数 。 

(3) 队 形 及 角色 的 确定 。 

规则 1: 若 对 手 很 强 , 则 采用 队 形 4( 严 密 防 守 ) 。 

规则 2: 若 对 手 很 弱 , 则 采用 队 形 2( 强 攻 队 形 ) 。 

规则 3: 若 球 在 1、2 区 域 时 , 则 采用 队 形 1。 

规则 4: 车 球 在 4、5、6 区 域 时 , 则 采用 队 形 3。 

规则 5: 若 球 在 3 区 域 时 , 则 采用 队 形 5。 

(4) 结合 队 形 和 角色 分 配 的 情况 ,根据 各 自 的 角色 向 相应 的 机 器 人 传人 动作 函数 ,从 
而 控制 机 器 人 动作 。 


10.5.6 各 种 定位 球状 态 的 判断 方法 


各 种 定位 球 坐 标 确定 方法 : 载 人 两 个 空 策略 , 单 击 Open Viewer 菜单 ,打开 
RSViwer ,选择 Ball ,将 球 移动 到 待 测试 点 后 单 击 Start 进入 比赛 状态 , 单 击 RSViwer 中 
的 Display 可 看 到 球 的 坐标 。 

自由 球状 态 的 判断 ; 其 位 置 关系 如 图 10-15 所 示 。 
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10-15 ”自由 球 的 位 置 关系 


在 自由 球状 态 下 , 球 与 机 器 人 的 摆 放 原则 如 下 : 将 场地 分 成 四 个 区 域 ,每 个 区 域 都 
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有 一 个 自由 球 罚 球 点 (FB) ,在 哪个 区 域 犯 规 , 就 在 该 区 域 罚 自由 球 ; @ 球 应 该 摆 放 在 罚 
球 点 上 ; 加 每 对 队 有 一 个 机 器 人 放 在 离 球 25cm 的 发 球 线 上 ; @ 其 他 机 器 人 应 该 放 在 这 
个 犯规 区 域外 ; 加 防守 方 机 器 人 应 在 靠近 自己 底线 的 一 边 ; @ 防 守 方 先 摆 机 器 人 。 

自由 球状 态 的 判断 方法 : 四 判断 球场 上 所 有 机 器 人 和 球 的 速度 非常 小 ; 四 判断 球 的 
位 置 是 否 在 发 球 点 上 ; @ 判 断 我 方 和 对 方 是 否 有 且 仅 有 一 个 机 器 人 在 球 的 附近 (相距 
25cm 左右 ) 。 

结合 以 上 3 个 条 件 就 可 以 判断 是 否 在 罚 自由 球 。 

点 球状 态 的 判断 : 其 位 置 关 系 如 图 10-16 所 示 。 











图 10-16 点 球 的 位 置 关系 


点 球状 态 下 球 与 机 器 人 的 摆 放 规则 如 下 : 四 踢 球 机 器 人 必须 放 在 球 的 后 方 ; @ 防 守 
的 守门 员 必 须 压 球门 线 ; 加 除了 足球 机 器 人 和 防守 守门 员外 ,其 他 机 器 人 都 在 另外 半 场 ; 
@ 防 守 方 先 扎 机 器 人 。 

点 球状 态 的 判断 方法 : 判断 球场 上 所 有 机 器 人 和 球 的 速度 非常 小 ; 加 判断 球 的 位 
牌 是 否 在 发 球 点 上 ; @ 判 断 我 方 和 对 方 是 否 有 且 仅 有 一 个 机 器 人 在 发 球 的 那个 半 场 。 结 
合 以 上 3 个 条 件 可 以 判断 是 否 在 罚 点 球 。 

球门 球状 态 的 判断 : 其 位 置 关系 如 图 10-17 所 示 。 

球门 球状 态 下 的 球 与 机 器 人 摆 放 规则 : 发 球 方 只 允许 有 一 个 守门 员 在 大 禁区 内 
@ 球 应 该 放 在 大 禁区 内 ; 四 防守 方 机 器 人 必须 在 自己 半 场 ; @ 防 守 方 先 氛 机 器 人 。 

球门 球状 态 的 判断 方法 : 判断 球场 上 所 有 机 器 人 和 球 的 速度 非常 小 ; 四 判断 球 的 
位 置 是 否 在 大 禁区 内 ; 加 判断 我 方 是 否 有 且 仅 有 一 个 机 器 人 在 大 禁区 内 ; @ 判 断 所 有 对 
方 球员 都 不 在 我 方 半 场 。 结 合 以 上 4 个 条 件 就 可 以 判断 是 否 在 罚球 门 球 。 


10.5.7 比赛 规则 


比赛 时 间 : 每 次 暂停 时 间 为 3min, 每 场 比 赛 最 多 叫 两 次 暂停 ;如 果 一 支 球 队 在 中 场 
休息 时 没有 准备 好 ,就 不 能 开始 下 半 场 比赛 ,休息 时 间 可 以 延长 5min。 若 在 延 时 后 球 队 
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图 10-17 球门 球 的 位 置 关 系 


仍 未 准备 好 继续 比赛 , 则 取消 其 比赛 资格 。 

比赛 开始 : 上 、 下 半 场 开始 时 ,总 是 蓝 队 先 开 球 ; 上、 下 半 场 开 球 ,以 及 进 球 后 重新 开 
球 时 , 球 放置 在 场地 中 心 处 , 开 球 方 必须 先 将 球 踢 向 自己 半 场 ;中 场 休息 后 ,双方 交换 比赛 
场地 。 

得 分 方法 : 当 球 整体 越过 对 方 球门 线 并 且 没 有 犯规 ,就 算 一 次 有 效 进 球 。 淘 汰 赛 在 
下 半 场 结束 之 后 出 现 平局 的 情况 下 ,采用 加 时 赛 突然 死亡 法 决定 胜 负 ( 金 球 ) 。 在 点 球 决 
胜 时 ,出 现下 列 情况 之 一 , 罚 点 球 结束 : 守门 员 在 门 区 内 抓 住 了 球 ; 开 球 后 球 深 出 球门 区 ; 
开 球 后 10s 之 后 如 果 一 方 被 剥夺 比赛 权利 、 技 术 故 障 或 者 主动 弃权 , 则 该 方 为 比赛 失利 
方 ,比分 为 0: 10。 

犯规 的 处 理 : 如 果 裁 判 员 认为 被 犯规 方 处 于 有 利 形势 , 则 可 以 不 判罚 犯规 ; 除 极 端 情 
况 外 , 控 球 队员 没有 犯规 行为 可 不 判罚 犯规 ;是 否 处 于 “极端 情况 ”由 裁判 员 判 断 。 

点 球 的 判罚 规则 : 防守 方 超过 一 个 机 器 人 在 球门 区 内 ,守门 员 在 10s 内 没有 把 球 跑 
出 球门 区 ,防守 方 超过 3 个 机 器 人 在 大 禁区 。 

球门 球 的 判罚 规则 : 当 进 攻 机 器 人 将 防守 方 守门 员 推 到 球门 里 面 ;进攻 时 超过 一 个 
机 器 人 进入 对 方 的 球门 区 ; 当 进 攻 方 机 器 人 在 防守 方 球门 区 里 干扰 防守 方 守门 员 ;在 球门 
区 里 面 发 生 伪 持 情况 超过 10s。 

自由 球 的 判罚 规则 : 在 球门 区 外 发 生 僵局 10s 以 上 。 

球 和 机 器 人 的 位 置 判定 规则 : 仅 当 一 个 机 器 人 有 超过 50% 的 体积 处 于 某 个 区 域 时 ， 
才 意 味 着 该 机 器 人 进入 此 区 域 。 当 球 的 整体 越过 球门 线 时 才 算 进 球 。 

补充 说 明 : 以 上 规则 只 是 整个 MLS 规则 的 一 部 分 ,比赛 的 时 候 请 完全 参照 FIRA 关 
于 MLS 的 官方 规则 文档 ;进入 仿真 平台 , 单 击 右 下 角 的 HELP 按钮 , 即 可 弹出 MLS 平台 
的 完全 说 明文 档 和 MLS 规则 文档 。 具 体 的 策略 源 代码 见 相 关 网 站 。 
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10.6 小 结 


本 章 介 绍 了 机 器 人 的 分 类 和 特性 ,机 器 人 系统 的 组 成 ,机 器 人 的 工作 空间 、 性 能 指标 
和 编程 语言 ,机 器 人 的 应 用 现状 ,通过 机 器 人 足球 案例 介绍 了 仿真 机 器 人 运动 控制 算法 。 

2018 年 ,美国 “国家 机 器 人 计划 2.0”(NRI-2. 0) 项 目 拟 支持 四 个 主要 研究 方向 ,重点 
研制 通用 协作 机 器 人 (co-robots)。 该 项 目 旨 在 推进 通用 协作 机 器 人 的 目标 : 可 伸缩 性 、 
可 定制 性 降低 准 入 门槛 .社会 影响 。 解 决 可 伸缩 性 的 主题 包括 : 机 器 人 如 何 与 多 个 人 或 
其 他 机 器 人 有 效 协作 ;机 器 人 如 何在 不 确定 的 真实 世界 环境 中 感知 规划、 行动 和 学 习 , 特 
别 是 以 分 布 式 的 方式 ;如 何在 复杂 环境 中 促进 机 器 人 的 大 规模 化 、 安 全 性 、 鲁 棒 性 和 操作 
可 靠 性 。 可 定制 性 包括 : 如 何在 对 硬件 和 软件 只 需 做 最 小 修改 的 情况 下 ,使 协作 机 器 人 
能 够 适应 特定 任务 、 环 境 或 人 ;机 器 人 如 何 个 性 化 地 与 人 进行 交互 ;机 器 人 如 何 自然 地 与 
人 进行 口头 的 和 非 语言 的 交流 。 降 低 准 入 门槛 的 主题 包括 : 开发 开源 的 协作 机 器 人 硬件 
和 软件 ,以 及 广泛 可 访问 的 试验 平台 。 社 会 影响 的 主题 包括 : 基础 研究 一 一 建立 机 器 人 
学 科 并 将 其 融入 教育 课程 ,通过 教育 途径 促进 机 器 人 工作 者 队伍 的 发 展 ;探讨 通用 协作 机 
器 人 对 我 们 未 来 的 社会 .经济 .伦理 和 法 律 的 影响 。 

要 从 体系 上 推动 机 器 人 的 智能 化 ,第 一 是 交互 能 力 , 第 二 是 群体 智能 。 未 来 ,工业 机 
器 人 的 多 模 态 语言 的 交互 会 使 机 器 人 的 编程 和 机 器 人 的 应 用 形成 一 种 快速 部 署 的 能 力 ， 
使 得 原来 的 工程 师 编 程 变 成 一 般 人 员 的 意图 表达 即 可 直接 实现 。 

智能 机 器 人 的 测评 很 重要 。 机 器 人 性 能 方面 的 测试 包括 : 自主 决策 与 功能 的 性 能 、 
智能 感知 性 能 ,智能 交互 性 能 、 智 能 控制 与 作业 性 能 。 机 器 人 的 安全 包括 功能 安全 、 机 械 
与 电气 安全 、 信 息 安全 等 。 


习题 


10.1 简 述 机 器 人 的 由 来 。 

10.2 分 析 比 较 各 国 对 机 器 人 的 定义 。 

10.3 人 的 手臂 (不 考虑 手掌 .手指 ,只 考虑 肩 \. 肘 、 腕 关节 ) 有 多 少 自由 度 ,为 什么 ? 以 用 
手 去 取 某 物 为 例 ,说 明 全 局 坐标 系 . 关 节 坐 标 系 . 工 具 坐 标 系 的 建立 。 

10.4 (思考 题 ) 四 个 真人 模拟 一 个 机 器 人 ,考查 用 三 块 积木 搭 一 个 拱门 任务 。 四 个 真人 
分 别 扮演 机 器 人 的 大 脑 ` 眼 睛 \ 左 手 和 右手 。 大 脑 的 职责 是 提出 实现 目标 的 计划 ， 
然后 指导 手 去 执行 计划 。 眼 睛 的 职责 是 将 场景 的 简要 描述 汇报 给 大 脑 。 手 只 能 执 
行 来 自 大 脑 的 简单 命令 。 
【提示 了 人 类 对 诸如 拿 起 茶杯 或 堆积 木 这 样 的 基本 任务 是 如 此 熟练 ,以 至 于 他 们 常 
常 认识 不 到 这 些 任 务 是 多 么 复杂 。 
大 脑 。 大 脑 从 眼睛 接受 输入 ,但 是 不 能 直接 看 到 场景 。 大 脑 是 唯一 知道 目标 是 什 
么 的 。 
眼睛 。 眼 睛 应 该 站 在 距离 工作 环境 几米 远 的 地 方 ,并 能 够 提供 定性 描述 (如 “在 它 
的 旁边 有 一 个 绿 方块 积木 ,在 绿 方块 上 面 有 一 个 红 方 块 ”) 或 定量 描述 (“ 绿 方块 在 
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10.5 


10.6 


10.7 


10.8 


蓝 色 圆柱 体 左 边 大 约 0. 6m 的 地 方 ”) 。 眼 上 晴 还 能 够 回答 来 自 大 脑 的 问题 ,如 “在 左 
手 与 红 方 块 之 间 是 否 有 空隙 ?” 如 果 你 有 一 个 视频 摄像 机 ,就 让 它 对 着 场景 ,并 允许 
眼睛 看 视频 摄像 机 的 取景 镜 , 而 不 是 直接 看 场景 。 

左手 和 右手 。 一 个 人 扮演 一 只 手 。 两 只 手 站 在 一 起 ;左手 只 使 用 他 的 左手 ,右手 只 
使 用 他 右手 。 手 只 能 执行 来 自 大 脑 的 简单 命令 例如 性 左手 ,向 前 移动 5cm。” 
它们 不 能 够 执行 除 运动 以 外 的 命令 ;如 “ 捡 起 方块 "不 是 一 只 手 能 完成 的 。 为 了 防 
止 作弊 ,你 或 许 要 给 手 戴 上 手套 ,或 者 让 他 们 操作 钳子 。 手 必须 被 蒙 上 眼 。 他 们 唯 
一 的 感官 能 力 是 能 够 断定 何 时 他 们 的 路 径 被 一 个 无 法 移动 的 障碍 物 所 阻挡 ,如 一 
张 桌子 或 另 一 只 手 。 在 这 种 情况 下 ,他 们 能 够 发 出 警报 声 把 困难 通知 大 脑 。 

(思考 题 ) 设 想 一 个 现在 还 没有 机 器 人 应 用 而 又 需要 机 器 人 的 具体 领域 或 问题 ,并 
作 简 要 描述 ,说 明 其 必要 性 、 可 行 性 。 

(思考 题 ) 阅 读 文献 , 阑 述 机 器 人 的 步 态 控制 方法 。 

【提示 了 可 参考 人 形 机 器 人 DARwIn- OP, 它 是 由 Virginia Tech 的 Dennis Hong 团 
队 、 宾 夕 法 尼 亚 大 学 、 普 渡 大 学 和 韩国 公司 Robotis 联合 设计 与 制造 的 。 它 的 硬件 
和 软件 都 是 开源 的 ,可 以 支持 灵活 的 组 装 方式 和 多 种 编程 语言 (如 C++ )。 关 于 它 
的 步 态 控制 ,可 以 参考 网 站 http://support. robotis. com/en/techsupport_eng. 
htm# product/darwin-op/development/tools/walking_tuner. htm。 

(思考 题 ) 分 别 在 网 上 搜索 几 种 典型 的 工业 机 器 人 、 服 务 机 器 人 、 娱 乐 机 器 人 ,探险 
机 器 人 、 安 防 机 器 人 ,并 通过 分 析 说 明 机 器 人 发 展 的 趋势 。 

(思考 题 ) 机 器 人 是 否 会 战胜 人 类 ,为 什么 ? 

【提示 了 机 器 人 是 否 战胜 人 类 这 个 话题 需要 从 多 个 能 力 分 析 。 例 如 ,机 器 人 的 运动 
能 力 能 否 战胜 人 类 ,机 器 人 的 视觉 能 力 能 否 战胜 人 类 ,机 器 人 的 推理 能 力 能 否 战 胜 
人 类 ,机 器 人 的 创造 能 力 能 否 战胜 人 类 ,机 器 人 的 情感 能 力 是 否 会 战胜 人 类 ,机 器 
人 的 灵感 能 力 是 否 会 超过 人 类 。 
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在 网 络 智能 方面 长 期 成 功 的 关键 是 发 展 能 够 以 自然 方式 通信 和 进行 交 
互 学 习 的 系统 。 传 统计 算 智 能 课题 的 研究 人 员 可 通过 直接 专注 于 网 络 促进 
智能 的 、 用 户 友 好 的 互联 网 系统 的 发 展 。 对 于 互动 的 ,信息 丰富 的 万 维 网 的 
需求 会 给 那些 经 验 丰 富 的 从 业者 带 来 巨大 挑战 。 要 求 具有 万 维 网 特性 的 解 
决 方案 的 问题 数量 巨大 ,这 就 需要 我 们 持续 不 断 地 推进 对 机 器 学 习 的 基础 研 
究 , 并 将 学 习 的 功能 结合 到 互联 网 的 每 一 种 交互 中 。 本 章 介绍 语义 网 与 本 
体 、Web 技术 、Web 挖掘 和 集体 智能 等 内 容 。 


11.1 概述 


众多 的 信息 资源 通过 互联 网 连接 在 一 起 ,形成 全 球 性 的 信息 系统 ,并 成 
为 可 以 相互 交流 、 相 互 沟通 、 相 互 参与 的 互动 平台 。 

1962 年 ,美国 国防 部 高 级 研究 计划 署 的 Licklider 等 提出 通过 网 络 将 计 
算 机 互联 起 来 的 构想 。1969 年 12 月 .ARPANET 将 美国 西南 部 的 加 州 大 学 
洛杉矶 分 校 . 斯坦 福 大 学 研究 学 院 ,加州 大 学 圣 塔 芭 芭 拉 分 校 和 犹他 州 大 学 
的 4 台 主 要 的 计算 机 连接 起 来 。 到 1970 年 6 月 , 麻 省 理工 学 院 、 哈 佛 大 学 、 
BBN 和 加 州 圣 达 莫 尼 卡 系统 发 展 公司 加 入 进来 。1972 年 ,ARPANET 对 公 
众 展示 ,并 出 现 了 E-mail。1983 年 ,ARPANET 完全 转移 到 TCP/IP。1995 
年 ,美国 国家 科学 基金 会 组 建 的 NSFNET 与 全 球 共 50 000 网 络 互 联 ,互联 
网 已 经 初 具 规 模 。 

互联 网 从 诞生 到 现在 ,可 以 分 为 4 个 阶段 , 即 计 算 机 互联 、 网 页 互联 、 用 
户 实时 交互 .语义 互联 。 

(1) 计算 机 互联 阶段 。20 世纪 60 年 代 第 一 台 主 机 连接 到 ARPANET 
上 ,标志 着 互联 网 的 诞生 和 网 络 互 联 发 展 阶 段 的 开始 。 在 这 一 阶段 ,伴随 着 
第 一 台 基 于 集成 电路 的 通用 电子 计算 机 IBM360 的 问世 、 第 一 台 个 人 电子 计 
算 机 的 问世 、UNIX 操作 系统 和 高 级 程序 设计 语言 的 诞生 ,计算 机 逐渐 得 到 
普及 ,形成 了 相对 统一 的 计算 机 操作 系统 ,有 了 方便 的 计算 机 软件 编程 语言 
和 工具 。 人 们 尝试 将 分 布 在 异地 的 计算 机 通过 通信 和 链 路 和 协议 连接 起 来 , 创 
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造 了 互联 网 ,形成 了 网 络 互联 和 传输 协议 的 通用 标准 TCP/ 了 ,在 网 络 地 址 分 配 、 域 名 解 
析 等 方面 也 形成 了 全 球 通用 的 、 统 一 的 标准 。 基 于 互联 网 ,人 们 可 以 在 其 上 开发 各 种 应 
用 。 例 如 ,这 一 阶段 出 现 了 远程 登录 ,文件 传输 以 及 电子 邮件 等 简单 ` 有 效 且 影响 深远 的 
互联 网 应 用 。 

(2) 网 页 互联 阶段 。1989 年 3 月 ,欧洲 量子 物理 实验 室 Berners-Lee 开发 了 主 从 结 
构 分 布 式 超 媒体 系统 (Web) 。 人 们 只 要 采用 简单 的 方法 ,就 可 以 通过 Web 迅速 方便 地 获 
得 丰富 的 信息 。 在 使 用 Web 浏览 器 访问 信息 资源 的 过 程 中 ,用 户 无 须 关 心 技术 细节 , 因 
此 Web 在 互联 网 上 一 经 推出 ,就 受到 欢迎 。1993 年 ,Web 技术 取得 突破 性 进展 ,解决 了 
远程 信息 服务 中 的 文字 显示 ` 数 据 连接 以 及 图 像 传递 的 问题 ,使 得 Web 成 为 互联 网 上 非 
常 流行 的 信息 传播 方式 。 全 球 范围 内 的 网 页 通过 超 文 本 传输 协议 连接 起 来 ,成 为 这 一 阶 
段 互 联网 发 展 的 显著 特征 。 通 过 这 一 阶段 的 发 展 ,形成 了 统一 资源 定位 符 (Uniform 
Resource Locator,URL) 、 超 文本 标记 语言 (HyperText Mark-up Language,HTML) 以 及 
超 文本 传输 协议 (HyperText Transfer Protocol，HTTP) 等 通用 的 资源 定位 方法 ,文档 格 
式 和 传输 标准 。WWW 服务 成 为 互联 网 上 流量 最 多 的 服务 ,开发 了 各 种 各 样 的 Web 
应 用 。 

(3) 用 户 实 时 交互 阶段 。 随 着 计算 机 、 互 联网 的 发 展 ,连接 在 互联 网 上 的 计算 设备 、 
存储 设备 能 力 有 了 大 幅 提升 。 到 20 世纪 90 年 代 末 ,万 维 网 已 经 不 再 是 单纯 的 内 容 提供 
平台 ,而 是 朝 着 提供 更 加 强大 和 更 加 丰富 的 用 户 交互 能 力 的 方向 发 展 , 如 博客 `QQ 、 维 
基 、 社 会 化 书签 等 。 这 一 阶段 与 第 二 阶段 的 网 页 互联 不 同 , 该 阶段 以 各 类 资源 的 全 面 互 
联 , 尤 其 以 应 用 程序 的 互联 为 主要 特征 ,任何 应 用 系统 都 会 或 多 或 少 地 依赖 互联 网 和 互联 
网 上 的 各 类 资源 ,应 用 系统 逐渐 转移 到 互联 网 和 万 维 网 上 进行 开发 和 运行。 

(4) 语义 互联 阶段 。 语 义 互 联 是 为 了 解决 在 不 同 应 用 .企业 和 社区 之 间 的 互 操作 性 
问题 。 这 种 互 操作 性 是 通过 语义 保证 的 ,而 互 操作 的 环境 是 异 质 、 动 态 、 开 放 、 全 球 化 的 
Web。 每 一 个 应 用 都 有 自己 的 数据 。 例 如 ,日 历 上 有 行程 安排 ,Web 上 有 银行 账号 和 照 
片 。 要 求 致 力 于 整合 的 软件 能 够 理解 网 页 上 的 数据 ,这 些 软件 能 够 检索 并 显示 照片 网 页 ， 
发 现 这 些 照片 的 拍摄 日 期 \ 时 间 及 其 描述 ;需要 理解 在 线 银行 账单 申请 的 交易 ;理解 在 线 
日 历 的 各 种 视图 ,并 且 清 楚 网 页 的 哪些 部 分 表示 哪些 日 期 和 时 间 。 数 据 必须 具有 语义 才 
能 够 在 不 同 的 应 用 和 社区 之 间 实 现 互 操作 。 通 过 语义 互联 ,计算 机 能 读 懂 网 页 的 内 容 , 在 
理解 的 基础 上 支持 用 户 的 互 操 作 。 

语义 网 可 使 机 器 阅读 数据 。 机 器 阅读 数据 更 快 、 更 准确 ,还 可 以 借助 机 器 学 习 , 让 机 
器 理解 数据 含义 。 这样 ,我 们 就 可 以 将 寻找 数据 的 任务 交 给 机 器 ,然后 阅读 机 器 寻找 到 的 
答案 即 可 。 但 是 ,机 器 可 以 理解 数据 含义 ,并 不 能 理解 文章 的 含义 ,因为 它 没 有 思想 ,所 以 
要 达到 理想 状态 ,还 需要 走 很 长 的 路 。 机 器 可 以 快速 地 处 理 数据 。 数 据 在 数据 库 中 有 一 
定 的 上 下 文 环境 ,进而 可 以 让 数据 链接 起 来 ,建立 关于 数据 的 参考 信息 。 

XML 可 用 于 建立 语义 数据 (semantic data) ,结果 描述 文件 为 RDF。 通 过 语义 数据 ， 
可 以 将 关系 数据 与 非 关系 数据 联系 在 一 起 。 这 将 改变 我 们 使 用 数据 的 方式 ,并 最 终 形成 
一 个 全 球 的 数据 库 。 

例如 ,在 英国 ,一 些 违反 社会 行为 规则 (ASBOs) 的 人 不 会 进 监狱 ,而 是 被 限制 出 人 某 
些 范围 。 一 个 手机 应 用 就 可 以 通过 公开 的 政府 数据 显示 某 个 区 域 有 多 少 这样 的 人 存在 。 
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还 有 的 手机 应 用 可 显示 某 些 区 域 有 多 少 牙医 。 

怎样 才能 让 自己 的 数据 成 为 语义 数据 呢 ? 首先 要 将 数据 上 网 ;然后 将 它 作 为 结构 化 
数据 提供 ;使 用 开放 的 标准 格式 ;使 用 URL 标识 事物 ;将 你 的 数据 链接 到 其 他 人 的 数据 。 
最 终 数 据 实现 全 球 化 的 链接 。 链 接 的 力量 是 非常 强大 的 ,我 们 需要 将 能 源 消 耗 、 健 康 、 医 
药 、 人 口 增长 等 数据 在 全 球 范围 内 链接 起 来 。 这 件 事 情 在 未 来 几 年 内 将 变 得 重要 起 来 。 

随 着 互联 网 的 大 规模 应 用 ,出 现 了 各 种 各 样 基于 互联 网 的 计算 模式 。 近 年 来 , 云 计算 
《cloud computing) 引 起 人 们 的 广泛 关注 。 云 计算 是 分 布 式 计算 的 一 种 范 型 , 它 强 调 在 互 
联网 上 建立 大 规模 数据 中 心 等 信息 技术 基础 设施 ,通过 面向 服务 的 商业 模式 为 各 类 用 户 
提供 基础 设施 能 力 。 在 用 户 看 来 , 云 计 算 提供 了 一 种 大 规模 的 资源 池 ,资源 池 管 理 的 资源 
包括 计算 存储、 平台 和 服务 等 各 种 资源 ,资源 池 中 的 资源 经 过 了 抽象 和 虚拟 化 处 理 , 并 且 
是 动态 可 扩展 的 。 云 计算 具有 下 列 特点 。 

(1) 面向 服务 的 商业 模式 。 云 计算 系统 在 不 同 层次 ,可 以 看 成 “软件 即 服务 ” 
(Software as a Service,SaaS) “平台 即 服务 ”(Platform as a Service， PaaS) 和 “基础 设施 
即 服务 ”(Infrastructure as a Service,IaaS) 等 。 在 SaaS 模式 下 ,应 用 软件 统一 部 署 在 服务 
器 端 ,用 户 通过 网 络 使 用 应 用 软件 ,服务 器 端 根 据 和 用 户 之 间 可 达成 细 粒 度 的 服务 质量 保 
障 协议 提供 服务 。 服 务 器 端 统一 对 多 个 租户 的 应 用 软件 需要 的 计算 存储、 带宽 资源 进行 
资源 共享 和 优化 ,并 且 能 够 根据 实际 负载 进行 性 能 扩展 。 

(2) 资源 虚拟 化 。 为 了 追求 规模 经 济 效应 , 云 计算 系统 使 用 了 虚拟 化 的 方法 ,从 而 打 
破 了 数据 中 心 .服务 器 、 存 储 、 网 络 等 资源 在 物理 设备 中 的 划分 ,对 物理 资源 进行 抽象 ,以 
虚拟 资源 为 单位 进行 调度 和 动态 优化 。 

(3) 资源 集中 共享 。 云 计算 系统 中 的 资源 在 多 个 租户 之 间 共 享 ,通过 对 资源 的 集中 
管控 实现 成 本 和 能 耗 的 降低 。 云 计算 是 典型 的 规模 经 济 驱动 的 产物 。 

(4) 动态 可 扩展 。 云 计算 系统 的 一 大 特点 是 可 以 支持 用 户 对 资源 使 用 数量 的 动态 调 
整 , 而 无 须 用 户 预先 安装 、 部 署 ,并 能 运行 峰值 用 户 请 求 所 需 的 资源 。 

互联 网 颠覆 了 人 们 的 生活 和 工作 方式 。 社 交 网 络 与 移动 终端 的 普及 .大 数据 的 产生 
与 汇聚 ,催生 出 越 来 越 多 的 新 需求 。 这 些 需求 必 将 推动 更 多 创新 应 用 (如 微 博 、 微 信 、 语 音 
助手 、 网 络 购 物 、 手 机 打车 .PM2.5 指数 .手机 钱包 、 互 联网 理财 交友、 移动 学 习 、 在 线 课 
程 等 ) 的 问世 。 由 于 创新 依赖 的 基础 设施 日 趋 完善 ,多 种 云 计算 服务 及 开源 平台 前 所 未 有 
地 降低 了 创新 的 成 本 ,使 得 人 们 可 以 将 精力 集中 到 创新 本 身 。 

得 益 于 网 络 和 云 计算 所 支持 的 令 人 惊叹 的 计算 能 力 , 以 及 从 大 数据 洞察 到 的 良机 ,还 
有 机 器 学 习 所 带 来 的 算法 进步 ,人 工 智能 获得 了 新 生 。 数 据 智能 .知识 智能 和 社会 智能 是 
智能 应 用 的 3 种 典型 模式 。 

数据 智能 是 在 大 规模 、 多 样 化 .新 鲜 的 数据 支持 下 ,在 云 计算 的 支撑 下 ,采用 机 器 学 习 
的 方法 进行 分 类 、 聚 类 和 排序 ,进而 基于 各 类 数据 驱动 实现 的 智能 应 用 系统 。 这 里 的 数据 
是 指 存在 于 万 维 网 (Web) 或 者 企业 内 部 的 海量 、 无 结构 或 者 半 结 构 的 数据 集合 。 这 类 数 
据 具 有 重复 性 、 元 余 性 和 多 样 性 等 特点 ,对 搜索 系统 、 问 答 系 统 、 推 理 系统 和 预测 系统 具有 
重要 意义 。 为 了 利用 数据 智能 ,我 们 须 经 过 数据 获取 、 去 品 、 抽 取信 息 、 建 立 索 引 等 若干 步 
又 形成 可 检索 的 数据 集合 。 我 们 也 可 以 利用 搜索 引擎 的 返回 结果 进行 实时 信息 抽取 ,以 
避免 存储 和 索引 全 网 而 付出 代价 。 
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知识 智能 是 指 利用 知识 库 、 词 典 和 规则 进行 推理 的 智能 系统 。 目 前 很 多 搜索 公司 都 
建立 了 大 型 知识 库 。Freebase、Yago2 和 DEPEDIA 等 知识 库 可 供 免 费 研 究 和 使 用 。 结 
构 化 、 半 结构 化 和 无 结构 化 的 数据 经 过 信息 抽取 技术 可 获取 实体 、 实 体 的 属性 和 实体 之 间 
的 关系 构成 一 个 知识 图 谱 。 知 识 图 谱 随 着 数据 的 更 新 而 演进 ,带动 知识 智能 不 断 提升 。 

社会 智能 是 指 利用 网 友 在 互联 网 上 直接 贡献 的 内 容 ( 包 括 网 页 锚 文 本 .用 户 标签 .用 
户 日 志 、 用 户 反馈 .社区 问答 、 社 会 关系 网 络 等 ) 实 现 用 户 参与 的 智能 应 用 。 在 社区 问答 
中 ,用 户 提 出 问题 ,其 他 网 友 回答 问题 。 久 而 久之 形成 的 问答 对 库 可 用 来 回答 新 的 问题 。 
这 些 问 题 和 答案 蕴涵 着 丰富 的 社会 智能 。 

注意 ,在 企业 里 也 存在 着 这 样 3 种 形态 的 智能 信息 。 企 业 的 网 页 文档 .电子 邮箱 、 新 
闻 、 交 易 数 据 等 可 以 看 作 是 数据 智能 ;企业 的 知识 库 、 本 体 、 产 品目 录 、 地 址 簿 、 客 户 关系 等 
可 以 看 作 是 知识 智能 ;企业 内 部 的 QQ、LINE、YAMMER、Wiki 的 数据 可 以 视 作 社会 智 
能 。 利 用 这 3 种 类 型 的 智能 信息 ,可 以 很 好 地 支持 商业 活动 ,提高 企业 的 运行 效率 。 


11.2 语义 网 与 本 体 


1999 年 ,Web 的 创始 人 Tim Berners-Lee(2016 年 图 灵 奖 得 主 ) 首 次 提出 了 “语义 网 ” 
(semantic web) 的 概念 。2001 年 2 月 ,W3C 正式 成 立 “Semantic Web Activity” 指 导 和 推 
动 语义 网 的 研究 和 发 展 ,语义 网 的 地 位 得 以 正式 确立 。2001 年 5 月 ,Tim Berners-Lee 等 
在 Scientific American 杂志 上 发 表 文 章 , 提 出 语义 网 的 愿景 。 


11.2.1 语义 网 的 层次 模型 


语义 网 提供 了 一 个 通用 的 框架 ,允许 跨越 不 同 应 用 程序 \ 企 业 和 团体 的 边界 共享 和 重 
用 数据 。 语 义 网 以 资源 描述 框架 (RDF) 为 基础 。RDF 以 XML 作为 语法 、URI 作为 命名 
机 制 , 将 各 种 不 同 的 应 用 集成 在 一 起 ,对 Web 上 的 数据 所 进行 的 一 种 抽象 表示 。 语 义 网 
所 指 的 “语义 ?是 “机 器 可 处 理 的 ?语义 ,而 不 是 自然 语言 语义 和 人 的 推理 等 目前 计算 机 所 
不 能 够 处 理 的 信息 。 

语义 网 要 提供 足够 而 又 合适 的 语义 描述 机 制 。 从 整个 应 用 构想 来 看 ,语义 网 要 实现 
的 是 信息 在 知识 级 别 上 的 共享 和 语义 级 别 上 的 互 操 作 性 ,这 需要 不 同系 统 间 有 一 个 语义 
上 的 “共同 理解 ” 才 行 。Berners-Lee 等 给 出 “语义 网 不 是 男 外 一 个 Web, 它 是 现 有 Web 的 
延伸 ,其 中 信息 被 赋予 了 良 定义 的 含义 ,从 而 使 计算 机 可 以 更 好 地 和 人 协同 工作 ”。 本 体 
自然 地 成 为 指导 语义 网 发 展 的 理论 基础 。2001 年 ,Berners-Lee 给 出 最 初 的 语义 网 体系 
结构 (图 2-34)。2006 年 ,Berners-Lee 给 出 了 新 的 语义 网 层次 模型 ,如 图 11-1 所 示 。 

新 的 Web 层次 模型 共 分 为 七 层 , 即 Unicode 和 URI 层 .XML 和 命名 空间 层 、RDF 十 
RDFS 层 \ 本 体 层 、 统 一 逻辑 层 . 证 明 层 、 信 任 层 。 下 面 简单 介绍 每 层 的 功能 。 

(1) Unicode 和 URI 层 。Unicode 和 URI 是 语义 网 的 基础 ,其 中 Unicode 处 理 资源 
的 编码 ,保证 使 用 的 是 国际 通用 字符 集 , 以 实现 Web 上 信息 的 统一 编码 。URI 是 统一 资 
源 定 位 符 URL 的 超 集 ,支持 语义 网 上 对 象 和 资源 的 标识 。 

(2) XML 和 命名 空间 层 。 该 层 包括 命 名 空间 和 XML Schema, 通 过 XML 将 Web 上 
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图 11-1 语义 网 层次 模型 


资源 的 结构 、 内 容 与 数据 的 表现 形式 进行 分 离 ,支持 与 其 他 基于 XML 标准 的 资源 进行 无 
颖 集成 。 

(3) RDF 十 RDFS 层 。RDF 是 语义 网 的 基本 数据 模型 ,定义 了 描述 资源 以 及 陈述 事 
实 的 三 类 对 象 : 资源 ,属性 和 值 。 资 源 是 指 网 络 上 的 数据 。 属 性 是 指 用 来 描述 资源 的 一 
个 方面 ,特征 、 属 性 以 及 关系 ,陈述 则 用 来 表示 一 个 特定 的 资源 , 它 包 括 一 个 命 了 名 的 属性 
和 它 对 应 资源 的 值 ,因此 ,一 个 RDF 描述 实际 上 就 是 一 个 三 元 组 : 二 object[ resourcej]， 
attribute[ property] ,value[ resource or literal] 二 。RDFS 提供 了 将 Web 对 象 组 织 成 层次 
的 建 模 原 语 , 主 要 包括 类 、 属 性 、 子 类 和 子 属性 关系 、 定 义 域 和 值 域 约束 。 

(4) 本 体 层 。 本 体 层 用 于 描述 各 种 资源 之 间 的 联系 ,采用 OWL 表示 。 本 体 揭示 了 
资源 以 及 资源 之 间 复 杂 和 丰富 的 语义 信息 ,将 信息 的 结构 和 内 容 分 离 ,对 信息 做 完全 形式 
化 的 描述 ,使 Web 信息 具有 计算 机 可 理解 的 语义 。 

(5) 统一 逻辑 层 。 统 一 逻辑 层 主要 用 来 提供 公理 和 推理 规则 ,为 智能 推理 提供 基础 。 
可 以 进一步 增强 本 体 语言 的 表达 能 力 ,并 允许 创作 特定 领域 和 应 用 的 描述 性 知识 。 

(6) 证 明 层 。 证 明 层 涉及 实际 的 演绎 过 程 以 及 利用 Web 语言 表示 证 据 , 对 证 据 进行 
验证 等 。 证 明 注 重 于 提供 认证 机 制 , 证 明 层 执行 逻辑 层 的 规则 ,并 结合 信任 层 的 应 用 机 制 
评判 是 否 能 够 信任 给 定 的 证 明 。 

(7) 信任 层 。 信 任 层 提供 信任 机 制 , 保 证 用 户 agent 在 Web 上 提供 个 性 化 服务 ,以 及 
彼此 之 间 安 全 可 靠 地 交互 。 基 于 可 信 agent 和 其 他 认证 机 构 , 通 过 使 用 数字 签名 和 其 他 
知识 才能 构建 信任 层 。 当 agent 的 操作 是 安全 的 ,而 且 用 户 信 任 agent 的 操作 及 其 提供 
的 服务 时 ,语义 网 才能 充分 发 挥 其 价值 。 

从 语义 网 层次 模型 来 看 ,语义 网 重用 了 已 有 Web 技术 ,如 Unicode`URI XML RDF 
等 ,所 以 它 是 已 有 Web 的 延伸 。 语 义 网 不 仅 涉 及 Web、 逻 辑 ,数据库 等 领域 ,层次 模型 中 
的 信任 和 加 密 模 块 还 涉及 社会 学 ,心理 学 .语言 学 .法律 等 学 科 和 领域 。 因 此 ,语义 网 的 研 
究 属于 多 学 科 交 叉 领域 。 
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11.2.2 本 体 的 基本 概念 


在 人 工 智 能 研究 中 有 两 种 研究 类 型 : 面向 形式 的 研究 (机 制 理论 ) 及 面向 内 容 的 研究 
(内 容 理 论 ) 。 前 者 处 理 逻 辑 与 知识 表达 ,而 后 者 处 理 知识 的 内 容 。 近 年 来 ,面向 内 容 的 研 
究 已 逐渐 引起 人 们 更 多 的 关注 ,因为 许多 现实 世界 的 问题 的 解决 (如 知识 的 重用 、 主 体 通 
信 、 集 成 媒体 ,大 规模 的 知识 库 等 ) 不 仅 需要 先进 的 理论 或 推理 方法 ,而 且 还 需要 对 知识 内 
容 进行 复杂 的 处 理 。 

目前 ,阻碍 知识 共享 的 一 个 关键 问题 是 不 同系 统 使 用 不 同 的 概念 和 术语 描述 其 领域 
知识 。 这 种 不 同 使 得 将 一 个 系统 的 知识 用 于 其 他 系统 变 得 十 分 复杂 。 如 果 可 以 开发 一 些 
能 够 用 作 多 个 系统 的 基础 的 本 体 ,这 些 系 统 就 可 以 共享 通用 的 术语 ,以 实现 知识 共享 和 重 
用 。 开 发 这 样 的 可 重用 本 体 是 本 体 论 研究 的 重要 目标 。 类 似 地 ,如 果 可 以 开发 一 些 支持 
本 体 合并 以 及 本 体 间 互 译 的 工具 ,那么 即使 是 基于 不 同 本 体 的 系统 ,也 可 以 实现 共享 。 

1. 本 体 的 定义 

本 体 的 几 个 代表 性 定义 如 下 。 

(1) 本 体 论 Contology) 是 一 个 哲学 术语 ,意义 为 "关于 存在 的 理论 ”, 特 指 哲学 的 分 支 
学 科 。 研 究 自然 存在 以 及 现实 的 组 成 结构 。 它 试图 回答 “什么 是 存在 “存在 的 性 质 是 什 
么 ”等 。 从 这 个 观点 出 发 ,形式 本 体 论 是 指 这 样 一 个 领域 , 它 确 定 客 观 事物 总 体 上 的 可 能 
的 状态 ,确定 每 个 客观 事物 的 结构 必须 满足 的 个 性 化 的 需求 。 形 式 本 体 论 可 以 定义 为 有 
关 存 在 的 一 切 形式 和 模式 的 系统 。 

(2) 本 体 是 关于 概念 化 的 明确 表达 。1993 年 ,美国 斯 坦 福 大 学 知识 系统 实验 室 
(KSL) 的 Gruber 给 出 了 第 一 个 在 信息 科学 领域 广泛 接受 的 本 体 的 正式 定义 。Gruber 认 
为 ,概念 化 是 从 特定 目的 出 发 对 所 表达 的 世界 进行 的 一 种 抽象 的 .简化 的 观察 。 每 一 个 知 
识 库 、 基 于 知识 库 的 信息 系统 以 及 基于 知识 共享 的 主体 都 内 含 一 个 概念 化 的 世界 ,它们 是 
显 式 的 或 是 隐 式 的 。 本 体 是 对 某 一 概念 化 所 做 的 一 种 显 式 的 解释 说 明 。 本 体 中 的 对 象 以 
及 它们 之 间 的 关系 是 通过 知识 表达 语言 的 词汇 描述 的 ,因此 可 以 通过 定义 一 套 知识 表达 
的 专门 术语 定义 一 个 本 体 , 以 和 人们 可 以 理解 的 术语 描述 领域 世界 的 实体 、 对 象 . 关 系 以 及 
过 程 等 ,并 通过 形式 化 的 公理 限制 和 规范 这 些 术 语 的 解释 和 使 用 。 因 此 ,严格 地 说 ,本 体 
是 一 个 逻辑 理论 的 陈述 性 描述 。 根 据 Gruber 的 解释 ,概念 化 的 明确 表达 是 指 一 个 本 体 是 
对 概念 和 关系 的 描述 ,而 这 些 概念 和 关系 可 能 是 针对 一 个 主体 或 主体 群体 而 存在 的 。 这 
个 定义 与 本 体 在 概念 定义 中 的 描述 一 致 ,但 它 更 具 普 遍 意 义 。 在 这 个 意义 上 ,本 体 对 于 知 
识 共 享 和 重用 非常 重要 。Borst 对 Gruber 的 本 体 定义 稍微 作 了 一 点 修改 ,认为 本 体 可 定 
义 为 被 共享 的 概念 化 的 一 个 形式 的 规格 说 明 。 

(3) 本 体 是 用 于 描述 或 表达 某 一 领域 知识 的 一 组 概念 或 术语 。 它 可 用 来 组 织 知识 库 
较 高 层次 的 知识 抽象 ,也 可 用 来 描述 特定 领域 的 知识 。 把 本 体 看 作 是 知识 实体 ,而 不 是 描 
述 知识 的 途径 。 本 体 这 一 术语 有 时 候 用 于 指 描 述 某 个 领域 的 知识 实体 。 例 如 ,Cyc 常 将 
它 对 某 个 领域 知识 的 表示 称 为 本 体 。 也 就 是 说 ,表示 词汇 提供 了 一 套用 于 描述 领域 内 事 
实 的 术语 ,而 使 用 这 些 词 汇 的 知识 实体 是 这 个 领域 内 事实 的 集合 。 但 是 ,它们 之 间 的 这 种 
区 别 并 不 明显 。 本 体 被 定义 为 描述 某 个 领域 的 知识 ,通常 是 一 般 意 义 上 的 知识 领域 , 它 使 
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用 上 面 提 到 的 表示 性 词汇 。 这 时 ,一 个 本 体 不 仅仅 是 词汇 表 , 而 是 整个 上 层 知 识 库 (包括 
用 于 描述 这 个 知识 库 的 词汇 )。 这 种 定义 的 典型 应 用 是 Cyc 工程 , 它 以 本 体 定义 其 知识 
库 , 为 其 他 知识 库 系 统 所 用 。Cyc 是 一 个 巨型 的 .多 关系 型 知识 库 和 推理 引擎 。 

(4) 本 体 属 于 人 工 智能 领域 中 的 内 容 理论 , 它 研究 特定 领域 知识 的 对 象 分 类 、 对 象 属 
性 和 对 象 间 的 关系 ,为 领域 知识 的 描述 提供 术语 。 

可 以 看 出 ,不 同 的 研究 者 站 在 不 同 的 角度 对 本 体 的 定义 会 有 不 同 的 认识 。 但 是 ,基本 
上 来 讲 , 本 体 应 该 包含 如 下 含义 。 

(1) 本 体 描述 的 是 客观 事物 的 存在 , 它 代 表 了 事物 的 本 质 。 

(2) 本 体 独 立 于 对 本 体 的 描述 。 任 何 对 本 体 的 描述 ,包括 人 对 事物 在 概念 上 的 认识 ， 
人 对 事物 用 语言 的 描述 ,都 是 本 体 在 某 种 媒介 上 的 投影 。 

(3) 本 体 独 立 于 个 体 对 本 体 的 认识 。 本 体 不 会 因为 个 人 认识 的 不 同 而 改变 , 它 反 映 
的 是 一 种 能 够 被 群体 所 认同 的 一 致 的 “知识 ”。 

(4) 本 体 本 身 不 存在 与 客观 事物 的 误差 ,因为 它 就 是 客观 事物 的 本 质 所 在 ,但 对 本 体 
的 描述 , 即 任何 以 形式 或 自然 语言 写 出 的 本 体 ,作为 本 体 的 一 种 投影 ,可 能 会 与 本 体 本 身 

(5) 描述 的 本 体 代 表 了 人 们 对 某 个 领域 的 知识 的 公共 观念 。 这 种 公共 观念 能 够 被 共 
享 、 重 用 ,进而 消除 不 同人 对 同一 事物 理解 的 不 一 致 性 。 

(6) 对 本 体 的 描述 应 该 是 形式 化 的 、 清 晰 的 、 无 二 义 的 。 

2. 本 体 的 种 类 

根据 本 体 在 主题 上 的 不 同 层次 ,将 本 体 分 为 顶层 本 体 (top-level ontology) 、 领 域 本 体 
(domain ontology)、 任 务 本 体 (task ontology) 和 应 用 本 体 (application ontology), 如 
图 11-2 所 示 。 图 中 ,顶层 本 体 研究 通用 的 概念 ， 
如 空间 时间、 事件 .行为 等 ,这 些 概念 独立 于 特 
定 的 领域 ,可 以 在 不 同 的 领域 中 共享 和 重用 。 
处 于 第 二 层 的 领域 本 体 则 研究 特定 领域 (如 图 
书 、 医 学 等 ) 下 的 词汇 和 术语 ,对 该 领域 进行 建 
模 。 与 其 同 层 的 任务 本 体 则 主要 研究 可 共享 的 | 应 用 本 体 | 
问题 求解 方法 ,其 定义 了 通用 的 任务 和 推理 活 图 11-2 本体 的 层次 模型 
动 。 领 域 本 体 和 任务 本 体 都 可 以 引用 顶层 本 体 
中 定义 的 词汇 描述 自己 的 词汇 。 处 于 第 三 层 的 应 用 本 体 描 述 具体 的 应 用 , 它 可 以 同时 引 
用 特定 的 领域 本 体 和 任务 本 体 中 的 概念 。 

实现 Web 数据 的 语义 表示 和 自动 处 理 是 未 来 互联 网 技术 发 展 的 一 个 长 期 的 目标 。 
目前 ,DARPA、W3C、Standford、MIT、Harvard、TC&C 等 众多 研究 机 构 都 在 为 实现 语义 
Web 的 远景 目标 而 努力 ,从 不 同 的 角度 探讨 解决 这 一 问题 的 方案 。 以 agent 技术 为 代表 
的 智能 处 理 模式 被 认为 是 在 广泛 分 布 . 异 构 和 不 确定 性 信息 环境 中 具有 良好 应 用 前 景 的 
模式 ,而 多 agent 在 语义 Web 上 运行 时 需要 使 用 本 体 ,因此 ,本 体 技 术 已 成 为 当前 语义 
Web 技术 的 研究 热点 。 

目前 ,在 信息 系统 领域 本 体 (ontology) 的 应 用 变 得 越 来 越 重 要 与 广泛 ,其 主要 应 用 包 
括 知识 工程 数据库 设计 与 集成 .信息 系统 互 操 作 、 仿 真 、 信 息 检 索 与 抽取 、 语 义 Web、 知 
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识 管理 、 智 能 信息 处 理 等 多 个 领域 。 
11.2.3 本 体 描 述 语 言 


建立 了 本 体 之 后 ,应 该 按照 一 定 的 规范 格式 对 本 体 进行 描述 和 存储 。 用 来 描述 本 体 
的 语言 称 为 本 体 描述 语言 (OWL)。OWL 使 得 用 户 能 够 为 领域 模型 编写 清晰 的 、 形 式 化 
的 概念 描述 ,因此 它 应 该 满足 以 下 要 求 : 四 良好 定义 的 语法 ; 四 良好 定义 的 语义 ; @ 有 效 
的 推理 支持 ; @ 充 分 的 表达 能 力 ; @@ 便 于 表达 。 

许多 研究 工作 者 都 在 致力 于 研究 OWL, 因 此 产生 了 多 种 OWL ,它们 各 有 千秋 ,包括 
RDF 和 RDF-S, OIL、 DAML. DAML + OIL、 OWL, XML. KIF. SHOE, XOL, OCML、 
Ontolingua、CycL、Loom 等 。 其 中 ,和 具体 系统 相关 的 (基本 上 只 在 相关 项 目 中 使 用 的 ) 
有 Ontolingua、CycL、Loom 等 ;和 Web 相关 的 有 RDF 和 RDF-S.OIL.DAML DAML 十 
OIL、OWL、SHOE、XOL 等 。 其 中 ,RDF 和 RDF-S、OIL、DAML、OWL、XOL 之 间 有 着 
密切 的 联系 ,是 W3C 的 本 体 语 言 标准 中 的 不 同 层次 ,也 都 是 基于 XML 的 。 而 SHOE 是 
基于 HTML 的 ,是 HTML 的 一 个 扩展 。 

OWL 是 一 种 本 体 的 标准 描述 语言 。OWL 建立 在 RDF 基础 上 ,以 XML 为 书写 工 
具 , 主 要 用 来 表达 需要 计算 机 应 用 程序 处 理 的 文件 中 的 知识 信息 ,而 不 是 呈 递 给 人 的 知 
识 。OWL 能 清晰 地 表达 词 表 中 各 词 条 的 含义 及 其 之 间 的 关系 ,这 种 表达 被 称 为 本 体 。 
OWL 相对 XML .RDF 和 RDF Schema 拥有 更 多 的 机 制 表达 语义 。 

OWL 形成 了 3 个 子 语言 : OWL Full.OWL DL 和 OWL Lite。3 个 子 语言 的 限制 由 
少 到 多 ,其 表达 能 力 依次 下 降 , 但 可 计算 性 ( 指 结论 可 由 计算 机 通过 计算 自动 得 出 ) 依 次 
增强 。 

(1) OWL Full: 支持 需要 在 没有 计算 保证 的 语法 自由 的 RDF 上 进行 最 大 程度 表达 
的 用 户 , 从 而 任何 推理 软件 均 不 能 支持 OWL Full 的 所 有 feature。OWL 允许 本 体 扩大 
预定 义 词汇 的 含义 , 即 它 允许 一 个 本 体 在 预定 义 的 (RDF、OWL) 词 汇 表 上 增加 词汇 ,但 
OWL Full 基本 上 不 可 能 完全 支持 计算 机 自动 推理 。 

(2) OWL DL: 得 名 于 它 的 逻辑 基础 描述 逻辑 (description logics)。OWL DL 
处 于 OWL Full 和 OWL Lite 之 间 , 兼 顾 表 达能 力 和 可 计算 性 。OWL DL 支持 所 有 的 
OWL 语法 结构 ,但 在 OWL Full 之 上 加 强 了 语义 约束 ,使 得 能 够 提供 计算 完备 性 和 可 判 
定性 。OWL DL 支持 需要 在 推理 系统 上 进行 最 大 程度 表达 的 用 户 , 这 里 的 推理 系统 能 够 
保证 计算 完全 性 和 可 判定 性 。 

(3) OWL Lite: 提供 最 小 的 表达 能 力 和 最 强 的 语义 约束 ,适用 于 只 需要 层次 式 分 类 
结构 和 少量 约束 的 本 体 , 如 词典 。 因 为 其 语义 较 简单 .所 以 OWL Lite 比较 容易 被 工具 
支持 。 








11.2.4 本 体 知 识 管理 框架 


本 体 是 语义 网 的 基础 ,可 以 有 效 地 进行 知识 表达 、 知 识 查询 或 不 同 领域 知识 的 语义 消 
解 。 本 体 还 可 以 支持 更 丰富 的 服务 发 现 . 匹 配 和 组 合 ,提高 自动 化 程度 。 本 体 知 识 管理 
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(ontology-based knowledge management) 可 实现 语义 级 知识 服务 ,提高 知识 利用 的 深度 。 
本 体 知识 管理 还 可 以 支持 对 隐 性 知识 进行 推理 ,方便 异 构 知识 服务 之 间 实 现 互 操作 ,方便 
融入 领域 专家 知识 及 经 验 知 识 结构 化 等 。 

本 体 知识 管理 一 般 要 求 满足 以 下 基本 功能 : 支持 本 体 多 种 表示 语言 和 存储 形式 ， 
具有 本 体 导 航 功能 ; @ 支 持 本 体 的 基本 操作 ,如 本 体 学 习 、 本 体 映 射 \ 本 体 合 并 等 ; @@ 提 
供 本 体 版 本 管理 功能 ,支持 本 体 的 可 扩展 性 和 一 致 性 。 图 11-3 给 出 了 一 种 本 体 知 识 管理 
框架 , 它 由 3 个 基本 模块 构成 。 


[one | here [oo er | 一 > 
| 本 = 


副 类 Domain 证 
一 
| 


语料库 数据 库 
图 11-3 基于 本 体 的 知识 管理 框架 












> [ow] 














(1) 领域 本 体 学 习 环 境 OntoSphere。 主 要 功能 包括 Web 语 料 的 获取 、 文 档 分 析 、 本 
体 概念 和 关系 获取 ,专家 交互 环境 ,最 终 建 立 满足 应 用 需求 的 高 质量 领域 本 体 。 

(2) 本 体 管理 环境 OntoManager。OntoManager 提供 对 已 有 本 体 的 管理 和 修改 
编辑 。 

(3) 基于 主体 的 知识 服务 OntoService。 提 供 面向 语义 的 多 主体 知识 服务 。 

按照 本 体 知识 管理 框架 ,中 国 科 学 院 计算 技术 研究 所 智能 科学 实验 室 的 史 忠 植 等 人 
研制 了 知识 管理 系统 KMSphere。 下 面 分 别 介绍 美国 和 德国 的 本 体 知 识 管 理 系统 
Protégé 和 KAON。 


11.2.5 本 体 知识 管理 系统 Protégé 


美国 斯 坦 福 大 学 斯 坦 福 医 学 信息 学 实验 室 (stanford medical informatics) 开 发 了 
Protégé 系统 , 它 是 开源 的 ,可 以 从 Protege 网 站 (http://protege. stanford. edu/) 免 费 下 
载 使 用 。 

1. 体系 结构 

Protégé 是 一 个 基于 Java 的 单机 软件 , 它 的 核心 是 本 体 编辑 器 。Protégé 采用 一 种 
可 扩展 的 体系 结构 ,使 得 它 非常 容易 添加 和 整合 新 的 功能 。 这 些 新 的 功能 以 插件 
(plug-in) 方 式 加 入 系统 。 它 们 一 般 是 Protégé 的 标准 版 本 之 外 的 功能 ,如 可 视 化 ,新 格 
式 的 导入 导出 等 。 目 前 有 3 种 类 型 的 插件 , 即 Tab、Slot Widgets 和 Backends。Tab 插件 
是 通过 添加 一 个 Tab 的 方式 扩展 Protege 的 本 体 编辑 器 ; Slot Widgets 被 用 于 展示 和 编 
辑 那 些 没有 默认 展示 和 编辑 工具 的 槽 值 ; Backends 主要 用 于 使 用 不 同 的 格式 导入 和 导 
出 本 体 。 

2. 知识 模型 

Protégé 的 知识 模型 是 基于 框架 和 一 阶 逻 辑 的 。 它 的 主要 建 模 组 件 为 类 、 槽 、 侧 面 和 











544 人 和 能 ( 务 3 硕 ) 


实例 。 其 中 ,类 以 类 层次 结构 的 方式 进行 组 织 ,并且 人 允许 多 重 继承 。 槽 则 以 槽 的 层次 结构 
进行 组 织 。 另 外 , Protege 的 知识 模型 允许 使 用 PAL (KIF 的 子 集 ) 语 言 表示 约束 
(constraints) 和 人 允许 表示 元 类 (metaclasses)。Protégé 也 支持 基于 OWL 的 本 体 建 模 。 

3. 本 体 编辑 器 

本 体 编 辑 器 提供 界面 浏览 和 编辑 本 体 , 如 类 层次 结构 .定义 槽 .连接 槽 和 类 、 建 立 类 的 
实例 等 。 它 同时 提供 搜索 、 复 制 . 粘 贴 和 拖 搜 等 功能 。 另 外 , 它 可 以 产生 多 种 本 体 文档 。 
一 些 其 他 研究 机 构 提供 的 插件 可 以 对 本 体 进 行 可 视 化 编辑 ,如 OntoViz。 

4. 互 操作 性 

一 旦 使 用 Protégé 建立 了 一 个 本 体 , 本 体 应 用 可 以 有 多 种 方式 访问 它 。 所 有 本 体 中 
的 词 项 都 可 以 使 用 Protege Java API 进行 访问 。Protege 的 本 体 可 以 采用 多 种 方式 进行 
导入 和 导出 。 标 准 的 Protege 版 本 提供 了 对 RDF(S) XML XML Schema 和 OWL 的 编 
辑 和 管理 。 


11.2.6 本 体 知 识 管理 系统 KAON 


KAON 是 德国 Karlsruhe 大 学 开发 的 本 体 知 识 管 理 系统 ,分 别 用 Karlsruhe 和 
Ontology 的 前 两 个 字母 组 成 ,KAON 网 站 为 http//kaon. semanticweb. org/。KAON 是 
一 个 面向 语义 驱动 的 业务 处 理 流 程 的 开放 源码 的 本 体 管理 架构 , 它 提供 了 一 个 完整 的 实 
现 ,可 以 帮助 领域 工程 师 较 容易 地 对 本 体 进 行 管理 和 应 用 。KAON 由 OI-Modeler、 
KAON API、RDF API 等 组 件 构成 。 

1. OI-Modeler 

OI-Modeler 是 本 体 构建 和 维护 的 一 种 工具 。 该 工具 可 用 于 编辑 大 型 本 体 论 以 及 合 
并 一 些 已 完成 的 有 用 的 本 体 。OI-Modeler 的 图 形 运算 法 则 基于 一 个 开放 的 TouchGraph 
数据 库 。 使 用 OI -Modeler 可 以 创建 一 个 新 的 本 体 或 打开 一 个 已 存在 的 本 体 , 提 供 本 体 
的 不 同 浏览 方式 ,可 以 检查 它 的 组 成 (概念 ,实例 、 属 性 和 词汇 ) .位 于 屏幕 上 半 部 的 图 示 窗 
口 ,显示 本 体 的 实体 、 本 体 间 的 关系 。 

OI-Modeler 的 重要 特点 之 一 是 支持 多 人 在 局 域 网 上 同时 构建 同一 本 体 。 本 体 的 合 
并 功能 也 是 构建 大 型 本 体 的 一 种 方法 ,但 合并 以 后 需要 对 其 中 的 语义 含义 和 词 间 关系 进 
行 修改 和 校正 ,尤其 是 一 些 相互 矛盾 的 语义 ,如 果 是 联机 同时 构建 ,在 试图 建立 与 已 有 语 
义 矛 盾 的 关系 时 ,系统 会 提示 不 能 进行 如 此 操作 ,并 给 出 原因 。 但 将 本 体 合 并 时 则 将 矛盾 
的 地 方 留 了 下 来 ,只 能 经 过 查找 显示 后 人 工 修改 。 

2. KAON API 

KAON API 可 用 来 访问 本 体 中 的 实体 。 例 如 ,在 下 列 针对 概念 的 接口 Concept、 针 对 
属性 的 接口 Property、 针 对 实例 的 接口 Instance 中 分 别 包 含 了 对 本 体 中 概念 、 属 性 和 实例 
的 访问 。 通 过 使 用 这 些 API, 可 以 对 本 体 演化 起 到 一 定 的 帮助 作用 。 

(1) 演化 日 志 : 负责 跟踪 本 体 在 演化 过 程 中 的 变化 ,以 便 在 适当 的 时 候 进行 可 逆 操 
作 ,进一步 而 言 , 还 可 以 利用 演化 日 志 对 分 布 的 本 体 进 行 演化 。 

(2) 修改 可 逆 性 : 为 本 体 演化 提供 取消 (undo) 和 再 次 实施 (redo) 操 作 , 可 以 使 已 经 
执行 了 修改 操作 的 本 体 回 溯 到 对 实施 修改 操作 之 前 的 状态 。 
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(3) 演化 策略 : 负责 确保 对 本 体 进行 变化 操作 后 本 体 仍 保持 一 致 的 状态 ,并 预防 非 
法 操作 。 此 外 ,演化 策略 还 允许 本 体 工程 师 定制 本 体 的 演化 过 程 。 

(4) 演化 图 示 : 为 本 体 工程 师 提供 对 本 体 演化 过 程 中 本 体 局 部 的 修改 展示 。 

(5) 本 体 包 含 : 与 依赖 演化 (dependant evolution) 相 关 , 负 责 管理 多 个 本 体 的 演化 去 
和 处理 。 

(6) 修改 改变 : 通过 一 组 工具 发 现 本 体 中 存在 的 问题 ,并 为 解决 发 现 的 问题 提供 决 
策 信息 。 

(7) 使 用 日 志 : 负责 跟踪 终端 用 户 在 与 基于 本 体 的 应 用 交互 时 产生 的 新 的 需求 ,以 
便 使 得 本 体能 够 立即 演化 ,以 适应 新 的 需要 。 

3. RDF API 

RDF API 提供 了 使 用 RDF 模型 的 程序 ,包括 模块 化 .RDF 解析 器 、RDF 序列 化 器 
(serializer) 等 处 理 组 件 。RDF API 允许 使 用 RDF 知识 库 , 为 KAON API 提供 了 最 初 的 
存储 机 制 ,而 且 可 被 RDF Server 连接 使 用 ,从 而 实现 多 用 户 对 RDF 知识 库 的 处 理 和 使 
用 。 一 个 显著 的 特点 是 支持 模型 的 包含 功能 ,允许 每 个 模型 都 包含 其 他 模型 。RDF API 
性 能 良好 ,已 经 用 于 AGROVOC( 本 体 论 的 测试 ,这 是 一 个 包含 32000 多 个 概念 支持 21 
种 语言 的 RDF 文件 )。RDF API 还 包含 一 个 RDF 解析 器 ,符合 RDF 标准 。 它 支持 xml: 
base 指令 ,也 支持 模型 包含 指令 ,但 不 支持 rdf:aboutEach 和 rdf:aboutEachPrefix 指令 。 
RDF API 的 RDF 序列 化 器 可 以 编写 RDF 模型 ,同样 支持 xml:base 指令 ,也 支持 模型 包 
含 指令 。 


11.3 ”Web 技术 的 演化 


20 世纪 90 年 代 初 ,Berners-Lee 提出 HTML、HTTP 和 万 维 网 (World Wide Web， 
WWW) ,为 全 世界 的 人 们 提供 一 个 方便 的 信息 交流 和 资源 共享 平台 ,将 人 们 更 好 地 联系 
在 一 起 。 由 于 应 用 的 广泛 需求 ,Web 技术 飞速 发 展 , Web 技术 的 演化 路 线 图 如 图 11-4 所 
示 。 图 中 , 横 坐 标 表 示 社 会 连接 语义 , 即 人 和 人 之 间 的 连接 程度 ; 纵 坐 标 表 示 信 息 连 接 语 
义 , 即 信息 之 间 的 连接 程度 ; 带 箭头 的 虚线 表示 Web 技术 的 演化 过 程 ,包括 PC 时 代 、 
Web 1. 0、Web 2.0、Web 3.0、Web 4.0。 在 云 平台 的 基础 设施 上 ,通过 跨 媒体 、 分 布 式 搜 
索 高 效 地 获取 所 需 知识 。 

人 类 一 直 在 围绕 着 3 个 世界 建立 “网 ”(Grids), 第 一 张 网 Grids 1.0, 即 交通 网 ;接着 
Grids 2.0, 即 能 源 网 ;Grids 3.0, 即 信息 网 或 互联 网 ;Grids 4.0, 即 物 联 网 ;现在 即将 开始 
第 五 张 网 的 建设 : Grids 5.0, 即 智联 网 (参见 11. 5. 5 节 )。 这 五 张 网 把 3 个 世界 整合 在 一 
起 ,其 中 交通 、 信 息 、 智 联 分 别 是 物理 ,心理 .虚拟 3 个 世界 自己 的 主 网 ,而 能 源 和 物 联 分 别 
是 第 一 和 第 二 、 第 二 和 第 三 世界 之 间 的 过 渡 , 即 人 类 通过 Grids 2. 0 从 物理 世界 获得 物质 
和 能 源 ,借助 Grids 4.0 由 人 工 世界 (或 称 虚 拟 世 界 、 智 理 世 界 ) 取 得 智 源 和 知识 。 围 绕 上 
述 五 张 网 ,人 类 社会 已 经 进行 了 一 系列 的 工业 革命 。 第 一 次 工业 革命 的 核心 是 蒸汽 机 ,第 
二 次 工业 革命 的 核心 是 电动 机 ,第 三 次 工业 革命 的 核心 是 计算 机 技术 ,第 四 次 工业 革命 的 
核心 是 网 络 ,特别 是 物 联 网 技术 。 人 类 已 开始 步 人 稳定 的 第 五 次 工业 革命 , 即 工业 5.0 之 
初始 阶段 , 接 下 来 就 是 虚实 平行 的 智能 机 推动 的 智能 时 代 。 


| 
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图 11-4 Web 技术 的 演化 路 线 图 


11.3.1 Web 1.0 


Web 将 互联 网 上 高 度 分 布 的 文档 通过 链接 联系 起 来 ,形成 一 个 类 似 于 蜘蛛 网 的 结 
构 。 文 档 是 Web 最 核心 的 概念 之 一 。 它 的 外 延 非 常 广泛 ,除了 包含 文本 信息 外 ,还 包含 

音频 ,视频 、 图 片 .文件 等 网 络 资源 。 

Web 组 织 文档 的 方式 称 为 超 文本 (hypertext) .连接 文档 之 间 的 链接 称 为 超 链接 
(Chyperlink) 。 超 文本 是 一 种 文本 ,与 传统 文本 不 同 的 是 对 文本 的 组 织 方式 。 传 统 文本 采 
取 的 是 一 种 线性 的 文本 组 织 方式 ,而 超 文本 的 组 织 方式 则 是 非 线性 的 。 超 文本 将 文本 中 
的 相关 内 容 通过 链接 组 织 在 一 起 ,这 很 贴近 人 类 的 思维 模式 ,从 而 方便 用 户 快速 浏览 文本 
中 的 相关 内 容 。 

Web 的 基本 架构 可 以 分 为 客户 端 . 服 务 器 以 及 相关 网 络 协议 3 个 部 分 。 服 务 器 承担 
了 很 多 烦琐 的 工作 ,包括 对 数据 的 加 工 和 管理 .应 用 程序 的 执行 ,动态 网 页 的 生成 等 。 客 
户 端 主要 通过 浏览 器 来 向 服务 器 发 出 请 求 , 服 务 器 在 对 请 求 进行 处 理 后 ,向 浏览 器 返回 处 
理 结果 和 相关 信息 。 浏 览 器 负责 解析 服务 器 返回 的 信息 ,并 以 可 视 化 的 方式 呈现 给 用 户 。 
支持 Web 正常 运转 的 常见 协议 如 下 : 

(1) 编 址 机 制 : URL 是 Web 上 用 于 描述 网 页 和 其 他 资源 地 址 的 一 种 常见 标识 方法 。 
URL 描述 了 文档 的 位 置 以 及 传输 文档 所 采用 的 应 用 级 协议 ,如 HTTP、FTP 等 。 

(2) 通信 协议 : HTTP 是 Web 中 最 常用 的 文档 传输 协议 。HTTP 是 一 种 基于 请 求 - 

应 范式 的 、 无 状态 的 传输 协议 。 它 能 将 服务 器 中 存储 的 超 文 本 信息 高 效 地 传输 到 客户 
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端的 浏览 器 中 去 。 
(3) 超 文本 标记 语言 : Web 中 的 绝 大 部 分 文档 都 是 采用 HTML 编写 的 。HTML 是 
一 种 简单 功能 强大 的 标记 语言 ,具有 良好 的 可 扩展 性 ,并 且 与 运行 的 平台 无 关 。HTML 
通常 由 浏览 器 负责 解析 ,根据 HTML 描述 的 内 容 , 浏 览 器 可 以 将 信息 可 视 化 地 呈现 给 用 
户 。 此 外 ,HTML 中 还 内 圣 了 对 超 链 接 的 支持 ,在 浏览 器 的 支持 下 ,用 户 可 以 快速 地 从 一 
个 文档 跳 转 到 另 一 个 文档 上 。 


11.3.2 Web 2.0 


2003 年 之 后 互联 网 走向 Web 2.0 时 代 。Web 2.0 是 对 Web 1.0 的 继承 与 创新 ,在 
使 用 方式 .内容 单 元 内 容 创建 ,内容 编 辑 ` 内 容 获取 内 容 管理 .音乐 等 方面 ,Web 2.0 较 
Web 1.0 有 很 大 的 改进 ( 表 11-1) 。 


表 11-1 Web 2.0 与 Web 1.0 的 功能 比较 


























Web 1.0 Web 2.0 
时 间 1993 一 2003 年 2003 年 以 后 
使 用 方式 浏览 网 页 用 户 参 与 
内 容 单元 网 页 博客 
内 容 创 建 网 络 程序 员 任何 人 协同 创建 (维基 百科 ) 
内 容 编辑 单一 信息 源 混搭 (mashup) 
内 容 获 取 屏幕 抓 取 网 络 内 容 分 析 
内 容 管理 目录 (分 类 ) 社会 化 书签 
音乐 mp3. com Napster 








1. 博客 

博客 (blog) 又 称 网 络 日 志 , 由 Web log 缩写 而 来 。 博 客 的 出 发 点 是 用 户 “ 织 网 ”, 发 表 
新 知识 ,链接 其 他 用 户 的 内 容 , 博 客 网 站 对 这 些 内 容 进行 组 织 。 博 客 是 一 种 简易 的 个 人 信 
息 发 布 方式 ,任何 人 都 可 以 注册 ,完成 个 人 网 页 的 创建 发 布 和 更 新 。 

博客 的 模式 充分 利用 网 络 的 互动 和 更 新 即时 的 特点 ,让 用 户 以 最 快 的 速度 获取 最 有 
价值 的 信息 与 资源 。 用 户 可 以 发 挥 无 限 的 表达 力 ,即时 记录 和 发 布 个 人 的 生活 故事 和 闪 
现 的 灵感 。 用 户 还 可 以 文 会 友 , 结 识 和 汇聚 朋友 ,进行 深度 交流 沟通 。 博 客 分 为 基本 的 博 
客 .小 组 博客 .家 庭 博客 .协作 式 博 客 .公共 社区 博客 和 商业 、 企 业 .广告 型 的 博客 等 。 

博客 大 致 可 以 分 成 两 种 形态 : 个 人 创作 ; 四 将 个 人 认为 有 趣 的 或 有 价值 的 内 容 推 
荐 给 读者 。 博 客 由 于 张贴 内 容 的 差异 .现实 身份 的 不 同 而 有 各 种 称谓 ,如 政治 博客 .记者 
博客 .新 闻 博 客 等 。 

2. 维基 

维基 (Wiki) 是 一 种 多 人 协作 的 写作 工具 。Wiki 站 点 可 以 由 多 人 维护 ,每 个 人 都 可 以 
发 表 自 己 的 意见 ,或 者 对 共同 的 主题 进行 扩展 和 探讨 。Wiki 是 一 种 超 文 本 系统 ,这 种 超 
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文本 系统 支持 面向 社区 的 协作 式 写 作 , 同 时 也 包括 一 组 支持 这 种 写作 的 辅助 工具 。 可 以 
对 Wiki 文本 进行 浏览 、 创 建 . 更 改 , 而 且 其 运行 代价 远 比 HTML 文本 小 。Wiki 的 写作 者 
自然 构成 一 个 社区 , Wiki 系统 为 这 个 社区 提供 简单 的 交流 工具 。Wiki 具有 使 用 方便 及 
开放 的 特点 ,有 助 于 在 社区 内 共享 知识 。 

Wiki 一 词 来 源 于 夏威夷 语 的 “wee kee wee kee”, 原 本 是 “ 快 点 快 点 ”的 意思 ,这 里 特 
指 维基 百科 。Wiki 著名 的 例子 是 维基 百科 (Wikipedia) ，Wales .Sanger 等 于 2001 年 1 月 
15 日 开始 创建 。 截 至 2009 年 初 ,维基 百科 在 世界 上 拥有 超过 250 种 语言 的 版 本 ,共有 超 
过 6 万 名 的 使 用 者 贡献 了 超过 1000 万 条 条 目 。2008 年 4 月 4 日 ,维基 百科 条 目 数 第 一 
的 英文 维基 百科 (http://en， wikipedia. org) 已 有 231 万 个 条 目 。 至 2018 年 9 月 7 日 ， 
达到 5 712 225 条 目 (content pages) ,45 808 771 页 面 (pages)。 中 文 维基 百科 于 2002 年 
10 月 24 日 正式 成 立 , 截 至 2008 年 4 月 4 日 ,中 文 维基 百科 已 拥有 171 446 个 条 目 。 

百度 百科 (http://baike. baidu. com) 开 始 于 2006 年 4 月 。2010 年 1 月 10 日 ,百度 
百科 收录 的 词 条 数 为 1 955 936。 截 至 2018 年 9 月 7 日 ,百度 百科 收录 15 527 809 个 
词 条 。 

3. 混搭 

混搭 Cmashup) 指 整合 互联 网 上 多 个 资料 来 源 或 功能 ,以 创造 新 服务 的 互联 网 应 用 程 
序 。 常 见 的 混搭 方式 除了 图 片 外 ,一 般 利用 一 组 开放 编程 接口 (open API) 取 得 其 他 网 站 
的 资料 或 功能 ,如 Amazon、Google、Microsoft、Yahoo 等 公司 提供 的 地 图 .影音 及 新 闻 等 
服务 。 由 于 对 于 一 般 使 用 者 来 说 ,撰写 程序 调用 这 些 功 能 并 不 容易 ,所 以 一 些 软件 设计 人 
员 开 始 制 作 程序 产生 器 , 替 使 用 者 生成 代码 ,然后 网 页 制作 者 就 可 以 很 简单 地 以 复制 一 粘 
贴 的 方式 制作 出 混搭 的 网 页 。 例 如 ,一 个 用 户 要 在 自己 的 博客 上 加 上 一 段 视 频 , 一 种 方便 
的 做 法 就 是 将 这 段 视 频 上 传 至 YouTube 或 其 他 网 站 ,然后 取 回 做 入 码 , 再 贴 回 自己 的 
博客 。 

4. 社会 化 书签 

社会 化 书签 (social bookmark) 又 称 网 络 收藏 夹 .是 普通 浏览 器 收藏 夹 的 网 络 版 ,提供 便 
捷 、 高 效 且 易 于 使 用 的 在 线 网 址 收藏 管理 ,分 享 功能 。 它 可 以 让 用 户 把 喜爱 的 网 站 随时 加 
入 自己 的 网 络 书 签 中 。 人 们 可 以 用 多 个 标签 .而 不 是 分 类 标识 和 整理 自己 的 书签 ,并 与 他 人 
共享 。 用户 收 藏 的 超 链 接 可 以 供 许多 人 在 互联 网 上 分 享 .因此 也 有 人 称 之 为 网 络 书签。 

社会 化 书签 服务 的 核心 价值 在 于 分 享 。 每 个 用 户 不 仅 能 保存 自己 看 到 的 信息 ,还 能 
与 他 人 分 享 自己 的 发 现 。 每 一 个 人 的 视野 和 视角 是 有 限 的 ,再 加 上 空间 和 时 间 分 割 ,一 个 
人 所 能 接触 到 的 东西 是 片面 的 。 知 识 分 享 可 以 大 大 降低 所 有 参与 用 户 获 得 信息 的 成 本 ， 
使 用 户 更 加 轻松 地 获得 更 多 数量 、 更 多 角度 的 信息 。 保 存 用 户 在 互联 网 上 阅读 到 的 有 收 
藏 价值 的 信息 ,并 作 必 要 的 描述 和 注解 ,积累 形成 个 人 知识 体系 。 人 们 通过 知识 分 类 ,可 
以 更 快 结交 到 具有 相同 兴趣 和 特定 技能 的 人 ,形成 交流 社区 ,通过 交流 和 分 享 互 相 增 强 知 
识 ,满足 沟通 、 表 达 等 社会 性 需要 。 社 会 化 书签 可 以 满足 个 人 收藏 .展示 的 性 格 需求 。 

Web 2.0 赢得 了 人 们 普遍 的 关注 ,软件 开发 者 和 最 终 用 户 使 用 Web 的 方式 发 生 了 变 
化 。 对 于 Web 1.0 应 用 来 说 ,用 户 和 Web 之 间 的 交互 方式 仅 限于 内 容 的 发 布 和 获取 ,而 
对 于 Web 2.0 应 用 来 说 ,用 户 和 Web 之 间 的 交互 方式 从 内 容 的 发 布 和 获取 已 经 扩展 到 
对 Web 内 容 的 参与 创作 、 贡 献 以 及 丰富 的 交互 。 在 Web 2.0 中 ,用 户 的 作用 将 越 来 越 
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大 ,他 们 提供 内 容 , 并 建立 起 不 同 内 容 之 间 的 相互 关系 ,还 利用 各 种 网 络 工具 和 服务 创造 
新 的 价值 。Web 2.0 的 特色 可 以 概括 为 以 下 4 点 。 

(1) 用 户 广泛 参与 。Web 2. 0 改变 了 过 去 用 户 只 能 从 网 站 获取 信息 的 模式 ,鼓励 用 
户 向 网 站 提供 新 内 容 , 对 网 站 的 建设 和 维护 做 出 直接 贡献 。 当 前 ,很 多 Web 2. 0 应 用 都 
支持 用 户 直接 向 网 站 中 发 布 新 的 内 容 , 如 博客 、Wiki 等 。 

(2) 新 的 应 用 开发 模式 。Web 2.0 倡导 了 一 种 新 的 应 用 开发 模式 , 即 由 用 户 通 过 重 
用 并 组 合 Web 上 的 不 同 组 件 创建 新 的 应 用 。 当 前 流行 的 混搭 就 是 这 样 一 类 技术 , 它 可 以 
让 用 户 利用 网 站 提供 的 API 和 服务 进行 二 次 开发 。 

(3) 利用 集体 智慧 。Web 应 用 的 创建 和 内 容 的 丰富 将 不 再 仅 依赖 于 开发 人 员 的 智 
慧 , 用 户 的 知识 也 会 对 应 用 构建 产生 直接 影响 ,集体 智慧 将 扮演 越 来 越 重 要 的 角色 。 
Wiki 是 这 类 应 用 的 典型 代表 , 它 的 目的 是 依赖 大 众 的 智慧 完善 Wiki 网 站 的 内 容 建设 。 
因此 , 它 又 被 看 作 是 一 种 人 类 知识 的 网 络 系统 。 

(4) 具有 社会 性 特点 。 社 会 性 是 人 类 的 根本 属性 。 人 存在 各 种 各 样 的 社会 性 需求 ， 
如 交友 、 聊 天 互动 等 。 当 前 ,Web 2. 0 应 用 也 越 来 越 具有 社会 性 特点 。 例 如 ,Facebook 这 
类 社交 网 站 的 主要 功能 就 是 提供 向 好 友 推 荐 .邀请 好 友 加 入 服务 等 。 社 会 性 为 网 站 带 来 
了 更 丰富 的 内 容 , 对 用 户 产生 了 巨大 的 吸引 力 。 


11.3.3 “Web.3.0 


Radar 网 络 公司 的 Spivack 认为 ,互联 网 (Internet) 的 发 展 以 十 年 为 一 个 周期 。 在 互 
联网 的 头 十 年 ,发 展 重心 放 在 互联 网 的 后 端 , 即 基 础 架构 上 。 编 程 人 员 开发 出 我 们 用 来 生 
成 网 页 的 协议 和 代码 语言 。 在 第 二 个 十 年 ,重心 转移 到 前 端 , Web 2. 0 时 代 就 此 拉 开 帷 
幕 。 人 们 使 用 网 页 作为 创建 其 他 应 用 的 平台 。 开 发 聚合 应 用 ,并 且 尝 试 让 互联 网 体验 更 
具 互 动 性 的 诸多 方法 。 目 前 我 们 正 处 于 Web 3. 0 ,重心 会 重新 转移 到 后 端 。 编 程 人 员 会 
完善 互联 网 的 基础 架构 ,以 支持 Web 3.0 浏览 器 的 高 级 功能 。 一 旦 这 个 阶段 告 一 段落 ， 
我 们 将 迈 入 Web 4.0 时 代 ( 图 11-4) ,重心 又 将 回 到 前 端 ,我 们 会 看 到 成 千 上 万 的 新 程序 
使 用 Web 3.0 作为 基础 。 

Web 3.0 最 本 质 的 特征 在 于 语义 的 精确 性 。 实 质 上 ,Web 3. 0 是 语义 网 系统 ,实现 更 
加 智能 化 的 人 与 人 和 人 与 机 器 的 交流 功能 ,是 一 系列 应 用 的 集成 。 它 的 主要 特点 是 : 

(1) 网 站 内 的 信息 可 以 直接 和 其 他 网 站 相关 信息 进行 交互 ,能 通过 第 三 方 信息 平台 
同时 对 多 家 网 站 的 信息 进行 整合 使 用 。 

(2) 用 户 在 互联 网 上 拥有 自己 的 数据 ,并 能 在 不 同 网 站 上 使 用 。 

(3) 完全 基于 Web ,用 浏览 器 就 可 以 实现 复杂 的 系统 程序 才 具 有 的 功能 。 

Web 3.0 将 互联 网 本 身 转 化 为 一 个 泛 型 数据 库 , 具 有 跨 浏览 器 , 超 浏览 器 的 内 容 投递 和 
请 求 机 制 ,运用 人 工 智能 技术 进行 推理 ,运用 3D 技术 搭建 网 站 ,甚至 虚拟 世界 。Web 3. 0 会 
为 用 户 带 来 更 丰富 、 相 关 度 更 高 的 体验 。Web 3. 0 的 软件 基础 将 是 一 组 应 用 编程 接口 
(APD ,让 开发 人 员 可 以 开发 能 充分 利用 某 一 组 资源 的 应 用 程序 。 

BBN 技术 公司 的 Hebeler 等 人 给 出 了 语义 网 的 主要 组 件 和 相关 工具 。 如 图 11-5 所 
示 , 语 义 网 的 核心 组 件 包 括 语义 网 陈述 、 统 一 资源 标识 符 CURI) .语义 网 语言 ,本体 陈述 和 
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实例 数据 ,形成 了 相互 关联 的 语义 信息 。 工 具 可 以 分 为 4 类 : 构造 工具 用 于 语义 网 应 用 
程序 的 构建 和 演化 ,询问 工具 用 于 语义 网 上 的 资源 探查 (explore) ,推理 机 负责 为 语义 网 
添加 推理 功能 ,规则 引擎 可 以 扩展 语义 网 的 功能 。 语 义 框架 最 终 将 这 些 工 具 打 包 成 一 个 
集成 套件 。 





推理 机 


实例 数据 


语言 








图 11-5 语义 网 的 主要 组 件 和 相关 工具 


11.3.4 互联 的 社会 


在 Web 进入 第 三 个 十 年 之 际 ,如 何 保障 互联 网 上 的 开放 ,安全 信任、 隐私 ,以 使 社会 
得 以 互联 ?Tim Berners-Lee 在 “Three challenges for the web” 一 文中 谈 到 几 个 问题 : 大 
公司 控制 了 个 人 数据 ,但 却 建 立 了 不 能 互联 的 数据 孤岛 ,数据 的 集中 导致 包括 政府 在 内 的 
组 织 滥用 这 些 数据 ,虚假 信息 和 广告 泛滥 、 误 导 网 民 。 

在 数据 开放 方面 ,Tim 推动 了 英国 政府 和 美国 政府 开放 政府 数据 。 目 前 已 经 有 数 以 
百 万 计 的 各 国政 府 数据 被 开放 出 来 ,涵盖 经 济 的 各 个 领域 ,并 催生 了 数 以 百 计 的 创业 公 
司 。 此 举 对 于 世界 经 济 未 来 可 能 具有 极 大 的 促进 作用 。 

Tim 也 在 推动 包括 大 公司 在 内 的 各 种 组 织 开放 数据 。 在 2009 年 TED 的 演讲 “未 来 
的 万 维 网 ”(the next web) 中 ,他 提出 了 “Raw data now!1” 的 口号 ,互联 数据 才 得 以 释放 数 
据 的 最 大 价值 。 他 多 次 向 脸 书 (Facebook) 等 社交 媒体 呼吁 数据 开放 ,并 积极 参与 到 分 布 
式 社交 网 络 (distributed social network ) 的 研究 和 开发 中 ,如 Crosscloud 和 Solid 系统 。 
更 关键 的 是 ,Tim 提出 了 数据 是 基本 人 权 。 

Tim 是 网 络 中 立 (net neurtality) 的 坚定 捍卫 者 。 他 认为 ,平等 和 自由 的 信息 获取 权 
是 基本 人 权 之 一 ,不 应 该 被 互联 网 服务 提供 商 (ISP) 或 其 他 组 织 以 商业 理由 伤害 。 他 也 
严厉 批评 了 美国 新 任 总 统 特 朗 普 在 此 问题 上 的 立场 。2013 年 ,他 发 起 了 平价 互联 网 联盟 
(Alliance for Affordable Internet，A4ADJ) ,致力 于 提升 发 展 中 国家 的 网 络 访问 速度 ,让 更 
多 的 人 获得 网 络 接 入 。 

Tim 发 起 和 参与 了 很 多 隐私 保护 的 研究 项 目 。 他 提出 了 信息 可 追 责 性 (information 
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accountability) 的 概念 ,并 在 近 十 年 中 在 法 律 、 社 交 媒 体 、 数 据 库 等 多 种 系统 中 实践 。 
Theory and Practice of Accountable Systems (TPAS) 项 目 致 力 于 建立 可 追 责 的 数据 系 
统 , 建 立 了 AIR 策略 语言 。Transparent Accountable Data Mining Initiative (TAMD) 项 
目 致力 于 在 数据 挖掘 中 保护 隐私 、 提 高 透明 性 。Private Information Retrieval (PIR ) 则 致 
力 于 在 信息 检索 中 进行 隐私 保护 。 

2009 年 ,Tim 创立 了 万 维 网 基金 会 (world wide web foundation) ,用 Web 促进 人 类 
社会 进步 ,推动 开放 、 自 由 、 互 联 。 

Tim 一 直 秉 持 一 个 理念 :“ 一 个 群体 是 否 能 够 发 展 取决 于 在 人 和 人 之 间 创 造 正确 的 
联系 ”,“ 如 果 我 们 成 功 ,创造 性 就 将 在 更 大 的 和 更 多 样 化 的 群体 中 出 现 。 这 些 高 级 思维 活 
动 原来 只 发 生 在 一 个 人 的 头脑 中 ,而 现在 将 出 现在 更 大 的 、 更 相互 联系 的 人 群 中 ”。 这 个 
梦想 一 旦 实现 , Web 就 可 以 发 展 为 一 种 “社会 机 器 "(social machine) ,人 类 提供 灵感 和 创 
造 ,而 机 器 提供 推理 和 日 常 管理 。 互 联 的 社会 可 能 会 引导 我 们 走向 “全 球 性 大 脑 ”。 

Tim Berners-Lee 是 一 位 伟大 的 思想 家 。 他 总 是 从 全 人 类 的 角度 去 思考 技术 问题 。 
普通 的 设计 师 从 “用 户 ” 的 角度 思考 问题 ,伟大 的 设计 师 从 "人 ”的 角度 思考 ,而 Tim 是 从 
“人 类 ”(humanity) 的 角度 去 设计 。Tim 是 当今 人 类 神经 系统 的 总 设计 师 。 他 的 哲学 思 
考 以 "设计 问题 ”design issues) 的 名 义 发 布 并 指导 着 Web 社区 。 他 的 工作 在 推动 历史 的 
进程 。 他 领先 于 大 多 数 的 工业 领袖 至 少 十 年 在 进行 布局 和 推动 。 他 又 善于 组 织 和 影响 ， 
对 于 学 术 界 和 欧美 政府 的 最 高 层 , 他 都 能 施加 影响 ,并 能 一 步 步 地 推进 和 具体 实施 。 

Tim 说 过 , Web 从 来 不 仅 是 技术 的 发 明 ,更 多 的 是 一 种 社会 的 创造 。 无 论 是 HTTP， 
还 是 网 页 排名 (PageRank) ,无 论 是 维基 ,还 是 脸 书 ,人 的 因素 都 是 主导 因素 。 开 放 、 交 流 、 
合作 ,新 一 代 的 Web 的 技术 必然 还 是 要 以 人 的 需要 长处、 局限 、 价 值 为 出 发 点 。 技 术 只 
是 一 小 部 分 ,社会 模式 的 变迁 才 是 最 根本 的 。 

在 2012 年 伦敦 奥运 会 开幕 式 上 ,Tim 打出 了 “为 所 有 人 ”(this is for everyone) 的 口 
号 。 人 允许 人 自由 地 以 他 自己 选择 的 方式 发 布 信息 ,允许 他 们 自己 相互 链接 , 没 人 需要 先 请 
示 任 何人 添加 一 个 链接 ,而 奇迹 会 在 这 互联 的 过 程 中 产生 。 一 个 互联 全 人 类 的 文档 .知识 
和 社会 的 网 络 , 是 人 类 文明 迈 向 下 一 步 不 可 缺少 的 ,也 是 Tim 上 毕生 的 信念 和 矢志 不 渝 为 
之 奋斗 的 目标 。 





11.4 Web 挖掘 


Google 于 2008 年 报告 指出 ,互联 网 上 的 Web 文档 已 超过 1 万 亿 个 。Web 已 经 成 为 
各 类 信息 资源 的 聚集 地 。 在 这 些 海量 的 、 异 构 的 Web 信息 资源 中 ,蕴涵 着 具有 巨大 潜在 
价值 的 知识 。 人 们 迫切 需要 能 够 从 Web 上 快速 有 效 地 发 现 资源 和 知识 的 工具 ,提高 在 
Web 上 检索 信息 ,利用 信息 的 效率 。 

Web 知识 发 现 已 经 引起 学 术 界 、 工 业界 、 社 会 学 界 的 广泛 关注 ,也 是 语义 网 和 Web 
科学 发 展 的 重要 基础 。Web 挖掘 是 指 从 大 量 Web 文档 的 集合 C 中 发 现 隐 含 的 模式 p 。 
如 果 将 C 看 作 输 入 ,将 p 看 作 输 出 ,那么 Web 挖掘 的 过 程 就 是 从 输入 到 输出 的 一 个 映射 
EC 一 力 。 

Web 知识 发 现 (挖掘 ) 是 从 知识 发 现 发 展 而 来 ,但 是 Web 知识 发 现 与 传统 的 知识 发 
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现 相 比 有 许多 独特 之 处 。 首 先 , Web 挖掘 的 对 象 是 海量 、 异 构 、 分 布 的 Web 文档 。 我 们 
认为 以 Web 作为 中 间 件 对 数据 库 进 行 挖掘 ,以 及 对 Web 服务 器 上 的 日 志 、 用 户 信 息 等 数 
据 展开 的 挖掘 工作 仍 属于 传统 数据 挖掘 的 范畴 。 其 次 ,Web 在 逻辑 上 是 一 个 由 文档 结 点 
和 超 链 构 成 的 图 ,因此 Web 挖掘 得 到 的 模式 可 能 是 关于 Web 内 容 的 ,也 可 能 是 关于 Web 
结构 的 。 此 外 ,由 于 Web 文档 本 身 是 半 结 构 化 或 无 结构 的 , 且 缺 乏 机 器 可 理解 的 语义 ,而 
数据 挖掘 的 对 象 局 限于 数据 库 中 的 结构 化 数据 ,并 利用 关系 表格 等 存储 结构 发 现 知识 , 因 
此 有 些 数据 挖掘 技术 并 不 适用 于 Web 挖掘 ,即使 可 用 ,也 需要 建立 在 对 Web 文档 进行 预 
处 理 的 基础 之 上 。 这 样 ,开发 新 的 Web 挖 据 技术 以 及 对 Web 文档 进行 预 处 理 以 得 到 关 
于 文档 的 特征 表示 , 便 成 为 Web 挖掘 的 研究 重点 。 

逻辑 上 ,我 们 可 以 把 Web 看 作 是 位 于 物理 网 络 上 的 一 个 有 向 图 G==(N,E), 其 中 结 
点 集 N 对 应 Web 上 的 所 有 文档 ,而 有 向 边 集 EE 对 应 结 点 之 间 的 超 链 。 对 结 点 集 作 进 一 
步 划 分 ,N= 二 {Ni ,Na}。 所 有 的 非 叶 结 点 Nu 是 HTML 文档 ,其 中 除了 包括 文本 外 ,还 包 
含 标记 ,以 指定 文档 的 属性 和 内 部 结构 ,或 者 嵌入 了 超 链 ,以 表示 文档 间 的 结构 关系 。 叶 
结 点 Ni 可 以 是 HTML 文档 ,也 可 以 是 其 他 格式 的 文档 ,如 PostScript 等 文本 文件 ,以 及 
图 形 .音频 等 媒体 文件 。 如 图 11-6 所 示 ,N 中 的 每 个 结 点 都 有 一 个 URL ,其 中 包含 了 关 
于 结 点 所 位 于 的 Web 站 点 和 目录 路 径 的 结构 信息 。 








Ni 超 文本 文件 


























媒体 文件 





图 11-6 ”Web 的 逻辑 结构 


Web 上 信息 的 多 样 性 决定 了 Web 知识 发 现 的 多 样 性 。 按 照 处 理 对 象 的 不 同 , 一 般 
将 Web 知识 发 现 分 为 三 大 类 : Web 内 容 发 现 (Web content discovery)、Web 结构 发 现 
(Web structure discovery)、Web 使 用 发 现 (Web usage discovery)。Web 知识 发 现 也 称 
为 Web 挖掘 。Web 挖掘 任务 的 分 类 如 图 11-7 所 示 。 
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图 11-7 Web 挖掘 任务 的 分 类 
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11.4.1 Web 内 容 挖掘 


Web 内 容 挖掘 是 指 对 Web 上 大 量 文档 集合 的 内 容 进 行 总 结 、 分 类 、 聚 类 .关联 分 析 ， 
以 及 利用 Web 文档 进行 趋势 预测 等 ,是 从 Web 文档 内 容 或 其 描述 中 抽取 知识 的 过 程 。 
Web 上 的 数据 既 有 文本 数据 ,也 有 声音 、 图 像 .图形 、 视 频数 据 等 多 媒体 数据 ; 既 有 无 结构 
的 自由 文本 ,也 有 用 HTML 标记 的 半 结 构 的 数据 和 来 自 数据 库 的 结构 化 数据 。 根 据 处 
理 的 内 容 可 以 将 Web 内 容 挖掘 分 为 两 个 部 分 , 即 Web 文本 挖掘 和 多 媒体 挖掘 。Web 文 
本 挖掘 和 通常 意义 上 的 平面 文本 挖掘 的 功能 和 方法 相似 ,但 是 有 其 自己 的 特点 。Web 文 
本 挖掘 的 对 象 除了 平面 的 无 结构 的 自由 文本 外 ,还 包含 半 结 构 化 的 HTML 文本 。Web 
文本 挖掘 是 以 计算 语言 学 、 统 计数 理 分 析 为 理论 基础 ,结合 机 器 学 习 和 信息 检索 技术 ,从 
大 量 的 文本 数据 中 发 现 和 提取 隐 含 的 、 事 先 未 知 的 知识 ,最 终 形成 用 户 可 理解 的 有 价值 
的 信息 和 知识 的 过 程 。 

文本 摘要 是 指 从 文档 中 抽取 关键 信息 ,用 简洁 的 形式 对 文档 内 容 进行 摘要 或 解释 。 
这 样 , 用 户 不 需要 浏览 全 文 ,就 可 以 了 解 文档 或 文档 集合 的 总 体内 容 。 文 本 摘要 在 有 些 场 
合十 分 有 用 ,例如 ,搜索 引擎 在 向 用 户 返回 查询 结果 时 ,通常 需要 给 出 文档 的 摘要 。 目 前 ， 
绝 大 部 分 搜索 引擎 采用 的 方法 都 是 简单 地 截取 文档 的 前 几 行 。 

文本 分 类 是 指 按照 预先 定义 的 主题 类 别 ,为 文档 集合 中 的 每 个 文档 确定 一 个 类 别 。 
这 样 , 用 户 不 但 能 够 方便 地 浏览 文档 ,而 且 可 以 通过 限制 搜索 范围 使 文档 的 查找 更 容易 。 
目前 , Yahoo 通过 人 工 对 Web 上 的 文档 进行 分 类 ,这 大 大 影响 了 索引 的 页 面 数目 (Yahoo 
索引 的 覆盖 范围 远 远 小 于 Alta-vista 等 搜索 引擎 ) 。 利 用 文本 分 类 技术 可 以 对 大 量 文档 
进行 快速 有效 的 自动 分 类 。 目 前 ,文本 分 类 的 算法 有 很 多 种 ,比较 常用 的 有 TFIDF 和 
Naive Bayes 等 方法 。 

文本 聚 类 与 分 类 的 不 同 之 处 在 于 , 聚 类 没有 预先 定义 好 的 主题 类 别 , 它 的 目标 是 将 文 
档 集 分 成 若干 类 ,要求 同一 类 内 文档 内 容 的 相似 度 尽 可 能 大 ,而 不 同类 间 的 相似 度 尽 可 能 
小 。Hearst 等 的 研究 已 经 证 明了 “ 聚 类 假设 ”, 即 与 用 户 查 询 相 关 的 文档 通常 会 聚 类 得 比 
较 靠 近 , 而 远离 与 用 户 查 询 不 相关 的 文档 。 因 此 ,可 以 利用 文本 聚 类 技术 将 搜索 引擎 的 检 
索 结果 划分 为 若干 类 ,用 户 只 需要 考虑 那些 相关 的 类 ,大 大 减 小 了 需要 浏览 结果 的 数量 。 
目前 有 多 种 文本 聚 类 算法 ,大 致 可 以 分 为 两 种 类 型 : 以 G-HAC 等 算法 为 代表 的 层次 凝 
聚 法 ;以 & 均值 等 算法 为 代表 的 平面 划分 法 。 

关联 分 析 是 指 从 文档 集合 中 找 出 不 同 词语 之 间 的 关系 。Brin 提出 了 一 种 从 大 量 文 
档 中 发 现 一 对 词语 出 现 模式 的 算法 .并 用 来 在 Web 上 寻找 作者 和 书 名 的 出 现 模式 ,从 而 
发 现 了 数 千 本 在 Amazon 网 站 上 找 不 到 的 新 书籍 。Wang 等 人 以 Web 上 的 电影 介绍 作 
为 测试 文档 ,通过 使 用 OEM 模型 从 这 些 半 结构 化 的 页 面 中 抽取 词语 项 ,进而 得 到 一 些 关 
于 电影 名 称 . 导 演 演员 、 编 剧 的 出 现 模式 。 

分 布 分 析 与 趋势 预测 是 指 通过 对 Web 文档 的 分 析 ,得 到 特定 数据 在 某 个 历史 时 刻 的 
情况 或 将 来 的 取 值 趋势 。Feldman 等 人 使 用 多 种 分 布 模型 对 路 透 社 的 两 万 多 篇 新 闻 进 行 
了 挖掘 ,得 到 主题 .国家 、 组 织 ` 人 、 股 票 交易 之 间 的 相对 分 布 情况 ,揭示 了 一 些 有 趣 的 趋 
势 。Wvthrich 等 通过 分 析 Web 上 出 版 的 权威 性 经 济 文章 ,对 每 天 的 股票 市 场 指数 进行 
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预测 ,取得 了 良好 的 效果 。 需 要 说 明 的 是 , Web 上 的 文本 发 现 和 通常 的 文本 发 现 的 功能 
和 方法 比较 类 似 ,但 是 Web 文档 中 的 标记 (如 二 Title 二 、 二 Heading 二 等 ) 蕴 涵 了 额外 的 
信息 ,我们 可 以 利用 这 些 信息 提高 Web 文本 发 现 的 性 能 。 


11.4.2 Web 结构 挖掘 


Web 结构 包括 页 面 内 部 的 结构 以 及 页 面 之 间 的 结构 。Web 组 织 结构 、Web 文档 结 
构 及 其 链接 关系 中 蕴藏 着 大 量 潜在 的 有 价值 的 信息 。Web 结构 挖掘 主要 是 从 Web 组 
织 结构 和 链接 关系 中 推导 信息 、 知 识 。 通 常 的 Web 搜索 引擎 等 工具 仅 将 Web 看 作 是 一 
个 平面 文档 的 集合 ,而 忽略 了 其 中 的 结构 信息 。Web 结构 挖掘 的 目的 在 于 揭示 蕴涵 在 这 
些 文档 结构 信息 中 的 有 用 模式 。 

文档 之 间 的 超 链接 反映 了 文档 之 间 的 某 种 联系 ,如 包含 .从 属 等 。 超 链 中 的 标记 文本 
(anchor) 对 链 宿 页 面 也 起 到 了 概括 作用 ,这 种 概括 在 一 定 程度 上 比 链 宿 页 面 作者 所 作 的 
概括 (页 面 的 标题 ) 更 客观 ,准确 。1998 年 ,Brin 和 Page 在 第 七 届 国 际 万 维 网 大 会 上 提出 
PageRank 算法 ,通过 综合 考虑 页 面 的 引用 次 数 和 链 源 页 面 的 重要 性 判断 链 宿 页 面 的 重 
要 性 ,从 而 设计 出 能 够 查询 与 用 户 请 求 相 关 的 “权威 "页 面 的 搜索 引擎 ,创立 了 搜索 引擎 
Google 公司 。 

在 互联 网 上 ,如 果 一 个 网 页 被 很 多 其 他 网 页 所 链接 ,说 明 它 受 到 普遍 的 承认 和 信赖， 
那么 它 的 排名 就 高 ,这 就 是 PageRank 的 核心 思想 。 当 然 ,Google 的 PageRank 算法 实际 
上 要 复杂 得 多 。Google 的 两 个 创始 人 Page 和 Brin 把 这 个 问题 变 成 了 一 个 二 维和 矩阵 相 乘 
的 问题 ,并 且 用 迭代 的 方法 解决 了 这 个 问题 。 他 们 先 假定 所 有 网 页 的 排名 是 相同 的 ,并 且 
根据 这 个 初始 值 算出 各 个 网 页 的 第 一 次 迭代 排名 ,然后 再 根据 第 一 次 迭代 排名 算出 第 二 
次 的 排名 。 他 们 三 人 从 理论 上 证 明了 不 论 初始 值 如 何 选取 ,这 种 算法 都 保证 了 网 页 排名 
的 估计 值 能 收敛 到 它们 的 真实 值 。 值 得 一 提 的 是 ,这 种 算法 是 完全 没有 任何 人 工 干 预 的 。 
PageRank 于 2001 年 9 月 被 授予 美国 专利 。 

在 第 九 届 年 度 ACM-SIAM 离散 算法 研讨 会 上 ,Jon Kleinberg 提出 HITS 算法 。 该 
算法 的 研究 工作 启发 了 PageRank 算法 的 诞生 。HITS 算法 的 主要 思想 是 网 页 的 重要 程 
度 是 与 所 查询 的 主题 相关 的 。HITS 算法 是 基于 主题 衡量 网 页 的 重要 程度 .相对 不 同 主 
题 ,同一 网 页 的 重要 程度 也 是 不 同 的 。 例 如 ,Google 对 于 主题 “搜索 引擎 ”和 主题 “智能 科 
学 ”的 重要 程度 是 不 同 的 。HITS 算法 使 用 了 两 个 重要 的 概念 : 权威 网 页 (authority) 和 中 
心 网 页 (hub)。 例 如 ,Google、Baidu、Yahoo、bing、sogou,soso 等 搜索 引擎 相对 于 主题 “ 搜 
索引 擎 ”来 说 就 是 权威 网 页 ,因为 这 些 网 页 会 被 大 量 的 超 链接 指向 。 这 个 页 面 链 接 了 这 些 
权威 网 页 , 则 这 个 页 面 可 以 称 为 主题 “搜索 引擎 ”的 中 心 网 页 。HITS 算法 发 现 ,在 很 多 情 
况 下 ,同一 主题 下 的 权威 网 页 之 间 并 不 存在 相互 的 链接 。 所 以 ,权威 网 页 通常 都 是 通过 中 
心 网 页 发 生 关 联 的 。HITS 算法 描述 了 权威 网 页 和 中 心 网 页 之 间 的 一 种 依赖 关系 : 一 个 
好 的 中 心 网 页 应 该 指向 很 多 好 的 权威 性 网 页 ,而 一 个 好 的 权威 性 网 页 应 该 被 很 多 好 的 中 
心性 网 页 所 指向 。 

每 个 Web 页 面 并 不 都 是 原子 对 象 ,其 内 部 有 或 多 或 少 的 结构 。Spertus 对 Web 页 面 
的 内 部 结构 做 了 研究 ,提出 了 一 些 启发 式 规 则 ,并 用 于 寻找 与 给 定 的 页 面 集合 {P ,…， 
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了 P,} 相 关 的 其 他 页 面 。Web 页 面 的 URL 可 能 会 反映 页 面 的 类 型 ,也 可 能 会 反映 页 面 之 间 
的 目录 结构 关系 。Spertus 提出 了 与 Web 页 面 URL 有 关 的 启发 式 规则 ,并 用 于 寻找 个 人 
主页 ,或 者 寻找 改变 了 位 置 的 Web 页 面 的 位 置 。 


11.4.3 ”Web 使 用 挖掘 


Web 使 用 挖掘 是 指 通过 挖掘 Web 日 志 记 录 , 发 现 用 户 访问 Web 页 面 的 模式 。 通 过 
分 析 和 探讨 Web 日 志 记 录 中 的 规律 ,可 以 识别 电子 客户 的 潜在 客户 ,增强 对 最 终 用 户 的 
因特网 信息 服务 的 质量 和 交付 ,并 改进 Web 服务 器 系统 的 性 能 。 

Web 服务 器 的 Weblog 项 通常 保存 了 对 Web 页 面 的 每 一 次 访问 的 Web 日 志 项 , 它 
包括 了 请 求 的 URL 发 出 请 求 的 IP 地 址 和 时 间 戳 。Weblog 数据 库 提供 了 有 关 Web 动 
态 的 丰富 信息 。 因 此 ,研究 复杂 的 Weblog 挖掘 技术 是 十 分 重要 的 。Chen 和 Mannila 等 
人 在 20 世纪 90 年 代 末 期 提出 了 将 数据 挖掘 运用 于 Web 日 志 领 域 ,从 用 户 的 日 志 中 挖掘 
出 用 户 的 访问 行为 。 经 过 儿 年 的 发 展 ,如 今 在 Web 使 用 挖 气 上 已 经 取得 进展 和 应 用 。 

目前 在 Web 使 用 挖掘 中 ,主要 的 研究 热点 集中 在 日 志 数 据 预 处理 、 模 式 分 析 算 法 的 
研究 (如 关联 规则 算法 、 聚 类 算法 )、 网 页 推荐 模型 .网 站 个 性 化 服务 与 自 适 应 网 站 的 构建 、 
结果 可 视 化 研究 等 。Chen 提出 最 大 向 前 引用 路 径 (maximal forward reference) ,将 用 户 
会 话 分 割 到 事务 层面 ,在 事务 的 基础 上 进行 用 户 访 问 模式 的 挖 据 。IBM Watson 实验 室 
采用 Chen 的 思想 构建 了 日 志 挖掘 系统 SpcedTracer, 该 系统 首先 重建 用 户 访问 路 径 识别 
用 户 会 话 ,在 此 基础 上 进行 数据 挖掘 。 

Perkowitz 等 人 提出 自 适应 网 站 (adaptive Web site) 的 概念 ,指出 用 户 理 想 的 网 站 是 
自 适 应 的 ,从 网 站 的 主页 开始 。 不 同 用 户 在 浏览 网 站 时 ,整个 网 站 的 内 容 像 是 专门 根据 他 


研究 方向 ,国外 已 经 出 现 不 少 的 原型 系统 , 如 PageGather、 Personal、 WebWatcher、 
WebPersonalizer、Websift 等 。 

WUM 是 一 个 被 较 多 人 熟知 的 系统 ,主要 用 于 分 析 用 户 的 浏览 行为 ,并 提出 一 种 类 似 
于 SQL 的 数据 挖掘 语言 MINT, 根 据 用 户 要 求 挖掘 满足 要 求 的 结果 。WUM 主要 包括 两 
个 模块 : 聚合 服务 和 MINT 处 理 器 。 聚 合 服 务 主要 将 采集 来 的 用 户 日 志 组 成 事务 ,再 将 
事务 转换 为 序列 。MINT 处 理 器 主要 是 从 聚合 数据 中 抽取 出 用 户 感 兴趣 的 有 用 的 模式 
与 信息 。WebMiner 系统 提出 了 一 种 Web 挖掘 的 体系 结构 ,用 聚 类 的 方法 将 Web 日 志 
划分 为 不 同 的 事务 ,并 采用 关联 规则 和 序列 模式 对 结果 进行 分 析 。Webtrend 是 一 个 具有 
商业 应 用 价值 的 日 志 控 掘 系统 ,能 够 统计 每 个 页 面 用 户 访问 的 频 度 以 及 时 间 分 布 ,还 能 统 
计 出 有 关联 关系 的 页 面 。 

随 着 Web 使 用 挖掘 技术 的 不 断 成 熟 ,在 数据 采集 数据 预 处 理 、 模 式 发 现 、 模 式 分 析 
等 方面 不 断 有 新 的 改进 算法 被 提出 。 由 于 Weblog 数据 提供 了 访问 的 用 户 信息 、 访 问 的 
Web 页 面 信息 ,因此 Weblog 信息 可 以 与 Web 内 容 和 Web 链接 结构 挖掘 集成 起 来 ,用 于 
Web 页 面 的 等 级 划分 .Web 文档 的 分 类 和 多 层次 Web 信息 库 的 构造 。 
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11.4.4 互联 网 信息 可 信 度 问题 


信息 可 信和 度 (information credibility) 是 信息 或 信息 源 被 信任 的 程度 ,通常 利用 计算 
技术 从 互联 网 上 挖掘 佐证 ,对 信息 可 信 度 进行 评估 。 

Web 2.0 时 代 的 来 临 极 大 地 降低 了 在 网 络 上 发 布 信息 的 门槛 “用 户 贡 献 的 内 容 ” 
(User Generated Content,UGC) 大 量 涌现 ,各 种 垃圾 、 虚 假 、 错 误 、 过 时 的 信息 开始 泛滥 ， 
网 络 信息 的 质量 令 人 担忧 。 不 可 信 的 信息 带 来 的 后 果 包 括 用 户 受骗 ,浪费 用 户 时 间 ,影响 
社会 稳定 等 。 

“信和 "不 等 于 “ 真 * 真 "是 客观 的 ,“ 信 "是 主观 的 ,“ 可 信 ” 只 是 说 “值得 信任 ”, 但 并 不 代 
表 经 过 了 实地 考察 或 实验 验证 ,所 以 不 是 * 真 ”"。 研 究 “ 可 信 信 息 (credible information)” 
的 目标 是 对 互联 网 信息 进行 去 粗 取 精 、 去 伪 存 真 的 计算 ,挑选 出 可 信 的 信息 ,对 可 信 信 息 
进行 搜索 和 管理 。 

信息 可 信 度 评估 的 对 象 包括 信息 ,也 包括 信息 源 。 信 息 又 包括 文本 信息 和 多 媒体 信 
息 。 文 本 信息 有 主观 和 客观 两 种 。 客 观 信 息 包括 词 条 、 新 闻 等 ,如 新 闻 “ 张 国 荣 2010 年 
11 月 在 北京 开演 唱 会 ”, 可 以 根据 张国荣 已 经 去 世 , 去 世 了 的 人 不 能 唱歌 ,推断 此 信息 不 
可 信 。 主 观 信息 包括 评论 .排名 等 ,如 * 中 国 第 一 美女 是 范冰冰 ?”, 没 有 客观 事实 作 评估 依 
据 , 只 能 根据 大 量 网 友 的 评论 计算 这 条 “主观 信息 ”的 可 信 程度 。 

多 媒体 信息 有 图 片 ( 如 周正 龙 的 华南 虎 照 片 的 真 伪 鉴别 )、. 语 音 ( 某 段 录音 是 不 是 剪辑 
而 成 ) ,视频 (是 不 是 剪辑 合成 的 ? 是 虚拟 的 ,还 是 现实 的 ?) ,地 图 (地 址 常常 变动 导致 地 图 
信息 的 可 信和 度 问 题 较为 突出 ) 。 

信息 源 包 括 网 站 ` 个 人 、 机 构 等 。 对 信息 源 可 信 度 的 评估 主要 是 根据 信息 源 发 布 的 信 
息 是 否 可 信 判 断 信息 源 的 可 信 度 。 有 时 ,尽管 信息 源 并 未 发 布 信息 ,也 可 以 根据 用 户 对 信 
息 源 信誉 的 网 络 评论 直接 推断 信息 源 的 可 信 度 。 

信息 可 信 度 研究 内 容 包括 以 下 6 个 方面 : 作者 分 析 : 作者 意图 发 现 、 对 作者 和 出 版 
者 名 誉 的 评估 ; @@ 面 向 各 种 媒体 的 可 信和 度 评估 : 新 闻 的 可 信和 度 、UGC 的 可 信和 度 评 价 、 在 线 
广告 的 可 信和 度 、Web 垃圾 (spam) 检 测 、 多 媒体 内 容 的 可 信和 度 、 社 会 网 络 中 的 可 信和 度 评估 ; 
图 时 空 分 析 : Web 可 信和 度 的 时 间 、 空 间 特 征 分 析 , 佑 计 信 息 的 时 间 、 出 处 和 有 效 性 ; @ 用 
户 研 究 : 信息 可 信和 度 评 估 中 的 社会 学 和 心理 学 、 信 息 可 信和 度 评估 中 的 用 户 研 究 ; @ 可 信 
信息 搜索 : Web 搜索 结果 的 可 信和 度 、Web 上 可 信 内 容 的 搜索 模型 ; @ 面 向 可 信和 度 评估 的 
Web 内 容 分 析 。 


11.4.5 案例 : 反恐 作战 数据 挖掘 


美军 非常 重视 数据 挖掘 技术 在 反 臣 作 战 中 的 应 用 。 慌 怖 分 子 通常 以 小 组 为 单位 分 散 
行动 ,并 尽量 采用 不 容易 被 识别 的 活动 方式 ,以 防止 被 发 现 。 然 而 ,数据 挖掘 技术 能 够 辨 
别 非 显而易见 的 关联 情况 并 提供 与 对 敌 作战 有 关 的 情报 ,因而 特别 适用 于 反 惑 作战 。 对 
于 在 伊拉克 和 阿富汗 街道 上 巡 风 的 美军 小 分 队 来 说 ,数据 挖掘 意义 重大 。 在 通过 网 络 实 
现 与 庞大 数据 库 的 连接 后 ,他 们 就 能 在 电话 号 码 和 E-mail 地 址 等 少量 孤立 信息 中 找 出 有 
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价值 的 东西 。 如 果 能 近 实时 地 完成 上 述 操作 ,他们 将 实现 以 * 非 常规 ”优势 对 抗 “ 非 常规 ” 
敌人 的 目的 。 

美国 特种 作战 司令 部 负责 实施 的 高 密级 情报 项 目 “A 级 威胁 (Able danger)” 计 划 就 
是 应 用 数据 挖掘 技术 的 典型 事例 。2005 年 12 月 , 原 美 国 参 联 会 主席 休 。 谢 尔 顿 将 军 首 
次 对 该 项 目 发 表 公 开 评 论 ,并 证 实 早 在 “9。11? 事 件 之 前 *A 级 威胁 ”项 目 就 已 确立 。 谢 
尔 顿 建议 他 的 继任 者 组 建 一 个 小 组 ,充分 利用 因特网 ,努力 搜寻 追捕 本 ，。 拉登 的 途径 或 是 
其 资金 来 源 之 类 的 信息 。 基 于 试验 的 目的 ,从 全 军 挑选 了 一 批 真正 的 计算 机 精英 组 成 了 
“A 级 威胁 ”小 组 。 

一 位 *A 级 威胁 ”小 组 成 员 于 2005 年 9 月 在 参议 院 司 法 委员 会 的 一 次 听证 会 上 称 ， 
“A 级 威胁 ?小 组 成 员 对 基地 组 织 疏 怖 分 子 网 络 实施 了 数据 挖掘 和 分 析 , 并 且 整 个 过 程 中 
不 断 与 特种 作战 司令 部 和 其 他 机 构 进行 协调 。“A 级 威胁 ”小 组 使 用 * 结 点 分 析 法 ”对 开 
放 源 信息 分 类 筛选 ,以 确定 基地 组 织 内 部 的 薄弱 环节 、 关 键 结 点 及 关联 情况 。“A 级 威 
胁 ” 小 组 从 一 个 宽泛 的 对 象 总 体 中 搜寻 特定 组 成 员 ( 如 基地 组 织 ) ,不 断 对 这 个 总 体 进行 细 
化 区 分 ,直到 组 成 员 得 到 确定 。 

由 于 数据 挖掘 注重 确认 事件 规律 和 发 现 模式 特征 ,因而 ,在 满足 全 球 反 您 作战 的 各 种 
复杂 情报 需求 方面 (例如 , 找 出 恺 怖 分 子 关 联 及 洪 在 威胁 方面 的 线索 ), 其 重要 作用 日 益 
显著 。 





11.4.6 案例: 微 博 博 主 特征 行为 数据 挖掘 


随 着 社交 网 络 在 互联 网 ,移动 互 联网 上 的 快速 发 展 , 社 交 网 络 用户 的 大 量 个 人 信息 在 
互联 网 上 公开 ,原本 碎片 化 的 信息 在 大 数据 环境 下 被 整合 ,并 由 此 形成 了 社交 网 络 的 大 数 
据 环境 。 针 对 社交 网 络 大 数据 的 统计 分 析 和 数据 挖掘 方法 成 为 商业 应 用 或 科学 研究 重要 
工具 之 一 。 与 此 同时 ,大 数据 的 挖掘 能 力也 威胁 到 用 户 的 个 人 隐私 保护 。 

按照 隐私 内 容 , 社 交 网 络 的 隐私 及 保护 问题 可 分 为 三 类 : 一 是 用 户 基 本 属性 .身份 及 
社会 关系 信息 ,包括 真实 姓名 、 性 别 、 年 龄 .所 属 机 构 、. 好 友 关 系 以 及 社会 影响 力 等 ,这 些 信 
息 可 用 来 在 现实 生活 中 对 社交 网 络 用 户 进行 定位 ;二 是 用 户 的 行为 属性 ,包括 发 帖 . 转 发 、 
评论 关注 的 时 间 和 频率 等 ,反映 了 用 户 在 现实 生活 中 的 作息 规律 ,行为 轨迹 并 进一步 构成 
了 用 户 的 行为 特征 ;三 是 用 户 的 精神 特征 属性 ,此 类 信息 可 通过 用 户 言论 的 潜在 语义 分 析 
进行 计算 ,包括 用 户 人 格 特征 、 价 值 观 取 向 、 自 我 认 知 状态 以 及 社会 需求 等 , 带 有 强烈 的 个 
人 色彩 ,反映 了 用 户 内 在 的 心理 状态 。 

上 述 三 类 用 户 隐 私 的 社交 网 络 大 数据 的 挖 握 工 作对 应 “ 知 著 、 见 微 、 晓 意 ” 这 三 个 维 
度 。 知 著 是 指 从 整体 上 认识 客观 世界 ,快速 计算 大 数据 的 宏观 特征 与 结构 ,是 整体 认识 客 
观 世 界 快速 而 又 有 效 的 方法 ; 见 微 是 指 在 宏观 结构 指导 下 有 针对 性 地 研究 有 代表 性 的 微 
观 数 据 ,这 里 并 不 需要 对 每 一 个 微观 都 进行 计算 ; 晓 意 是 指 大 数据 语言 内 容 的 含义 ,是 语 
义 的 理解 与 认 知 ,属于 自然 语言 理解 的 范畴 。 

1. 宏观 特征 大 数据 挖掘 

针对 用 户 的 基本 社会 属性 ,采用 面向 用 户 群体 的 宏观 特征 分 析 , 结 合 1700 万 新 浪 微 
博 具 有 真实 身份 的 用 户 数据 对 “ 微 博 生态 系统 ”一 一 一 个 包含 微 博 用 户 、 用 户 发 帖 以 及 用 
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户 其 他 活动 行为 的 有 机 整体 一 一 进行 深度 分 析 , 包 括 基 本 统计 特征 分 析 、 数 字 化 特征 分 析 
以 及 文本 特征 分 析 , 进 而 充分 掌握 新 浪 微 博 用 户 的 各 种 宏观 信息 , 据 此 构建 用 户 影响 力 模 
型 ,并 对 用 户 意图 做 深入 研究 。 

讨论 在 宏观 角度 下 对 微 博 隐 私 挖掘 的 分 析 结 果 , 其 中 重点 包括 微 博 数据 基本 统计 信 
息 ,数值 特征 分 析 、 用 户 倾向 性 分 析 等 。 从 隐私 保护 的 角度 看 ,宏观 特征 反映 的 是 一 个 国 
家 在 线 社交 网 络 的 总 体 特点 。 从 国家 安全 的 角度 看 ,超大 规模 人 群 的 各 类 统计 数据 存在 
宏观 战略 安全 的 隐患 。 

分 析 所 用 的 数据 集 采 集 自 新 浪 , 经 过 大 量 筛选 处 理 , 清 洗 后 的 数据 规模 为 1700 万 ( 气 
除 大 量 机 器 自动 生成 的 僵尸 用 户 及 休眠 用 户 )。 数 据 集 中 包含 多 个 字段 ,如 微 博 ID 、 性 
别 \ 昵 称 、 生 日 地区、 自我 介绍 ,发 微 博 数 粉丝 数 、 关 注 数 、 博 客 地 址 、 教 育 经 历 以 及 认证 
等 级 。 

在 基本 统计 特征 分 析 中 ,着 重 研 究 地 理 分 析 、 性 别 分 析 、 教 育 和 年 龄 分 析 3 个 指标 ,从 
中 获得 了 以 下 问题 的 答案 : 哪些 地 区 拥有 最 大 的 用 户 密度 ? 男性 用 户 与 女性 用 户 之 间 有 
什么 关系 ? 用 户 的 受 教 育 程 度 与 年 龄 分 布 如 何 ? 

2. 微 博 用 户 行为 特征 模型 研究 

旨 在 从 个 人 的 微 博 内 容 与 行为 矩阵 建立 个 性 与 行为 模型 。 网 络 平台 中 ,用 户 通常 会 
产生 丰富 的 行为 ,如 登录 、 单 击 等 。 具体 到 微 博 平台 的 主要 行为 又 可 体现 为 登录 、 上 传 照 
片 ,发布 微 博 、 评 论 等 。 微 博 用 户 行为 是 指 一 个 用 户 在 某 一 特定 的 时 间 段 内 在 微 博 平 台 上 
进行 社交 或 其 他 自主 活动 时 发 生 的 行为 ,包括 发 送 原 创 微 博 、 转 发 微 博 、 关 注 微 博 用 户 ,被 
微 博 用 户 关注 、 账 号 登录 、 账 号 退出 发表 评论 ,赞同 微 博 。 我 们 定义 的 微 博 用 户 行为 是 一 
种 用 户 微观 行为 。 用 户 个 体 行 为 特征 的 模式 分 析 恰 恰 暴 露 了 大 量 的 个 人 隐私 信息 ,如 个 
人 作息 与 活动 规律 (如 夜生活 的 频 度 .出 差 的 频 度 等 ); 若 结合 地 域 分 布 , 则 还 可 以 明确 每 
个 人 的 行踪 ;甚至 可 以 通过 工作 日 与 休息 日 的 活动 模式 对 比 挖掘 出 是 否 是 上 班 族 ,是 否 是 
有 钱 有 闲 的 阶层 ,从 另外 的 角度 发 现 个 人 的 工作 状态 与 经 济 状况 。 

针对 用 户 的 行为 信息 ,从 微观 层面 人 手 , 从 社交 网 络 用 户 的 行为 中 提取 特定 的 行为 模 
式 。 研 究 表明 , 征 博 用 户 的 群体 行为 表现 出 两 段 阶梯 寡 率 分 布 的 规律 。 但 由 于 用 户 行为 
记录 的 不 规律 性 与 随意 性 ,加 上 其 受制 于 用 户 本 人 的 习惯 ,生活 ,学习 或 工作 等 客观 因素 ， 
个 体 行为 的 研究 目前 还 主要 是 限于 写作 风格 和 文本 特征 ,对 其 中 某 个 客观 因素 的 研究 ,以 
及 简单 的 统计 研究 等 。 通 过 行为 矩阵 模型 ,用 于 描述 微 博 用 户 的 行为 活动 通过 行为 矩阵 
分 析 法 加 深 对 用 户 行为 的 理解 ,对 于 好 友 推 荐 .身份 推理 、 群 体 分 析 以 及 精准 营销 等 领域 
的 研究 和 应 用 都 有 深刻 的 意义 。 

3. 微 博 博 主 的 价值 观 自动 评估 方法 

通过 基于 社交 网 络 的 价值 观 自动 评估 方法 (Automatic Estimation of Schwartz 
Value,AESV) ,可 以 根据 人 们 社交 网 络 上 的 发 言 或 转发 对 人 的 价值 观 自动 进行 评估 ,并 
且 能 够 适应 不 同 的 社会 背景 ,包括 语言 和 时 间 的 变化 。 

价值 观 是 人 们 对 生活 中 不 同事 物 重要 性 的 理解 ,对 个 人 或 组 织 行为 及 态度 起 着 很 大 
的 支配 作用 。 施 瓦 兹 提出 的 价值 观 模型 在 82 个 国家 的 大 规模 验证 试验 中 被 证 实 具有 较 
高 的 普遍 适用 性 。 而 且 经 过 上 百 项 研究 的 验证 ,价值 观 和 行为 选择 间 具 有 很 强 的 关系 , 因 
此 可 以 作为 对 个 人 或 组 织 行 为 选择 进行 推测 的 重要 依据 ,并 应 用 于 商业 或 政治 的 各 个 领 
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域 。 个 人 价值 观 的 计算 将 暴露 个 人 隐私 中 更 深层 次 的 精神 世界 ,如 精神 是 否 健康 .价值 观 
是 否 存 在 偏颇 等 。 

施 瓦 兹 价值 观 从 人 生存 的 基本 需求 出 发 ,定义 了 10 种 价值 种 类 , 即 享乐 ,仁爱 、 普 世 、 
权力 .成 就 .传统 、 遵 从 、 安 全、 自我 定向 以 及 刺激 ,每 种 价值 类 下 都 包含 若干 具体 价值 。 现 
有 的 研究 工作 已 证 明 价 值 优 先 级 不 同 导致 个 人 言论 的 主题 和 用 词 存 在 很 大 差异 , 张 华 平 
等 人 据 此 提出 了 AESV 模型 。 该 模型 包含 以 下 3 个 步骤 : 生成 价值 向 量 空 间 的 特征 索 
引 、 计 算 动态 价值 观 向 量 以 及 评估 个 人 价值 观 优 先 级 。 

价值 观 作为 个 性 中 表明 社会 需求 和 和 欲望 的 一 个 重要 方面 ,在 电子 商务 .社交 网 络 、 组 
织 行为 分 析 以 及 与 情 监控 和 预测 等 多 个 领域 得 到 广泛 应 用 。 传 统 的 价值 观 评估 采用 基于 
量 表 的 调查 问卷 方式 ,时 间 和 经 济 成 本 较 高 。 张 华 平 等 人 利用 价值 观 和 词语 运用 之 间 的 
语言 学 联系 ,根据 用 户 发 表 在 社交 网 络 上 的 公开 言论 自动 对 其 进行 价值 观 评估 ,从 而 掌握 
用 户 的 行为 偏好 及 社会 需求 。 

社交 网 络 中 大 量 公开 的 个 人 数据 为 上 述 3 种 分 析 提 供 了 相对 便利 的 条 件 。 张 华 平等 
人 以 新 浪 微 博 为 例 , 通 过 数据 抓 取 、 模 型 分 析 以 及 实例 研究 等 方法 ,展现 社交 网 络 环境 下 
如 何 通过 大 数据 挖掘 手段 获取 用 户 的 社会 属性 ,行为 模式 以 及 心理 状态 等 个 人 隐私 信息 。 
这 些 方法 在 创造 商业 及 研究 价值 的 同时 ,也 在 一 定 程度 上 透露 了 用 户 的 隐私 ,并 带 来 了 一 
系列 消极 体验 。 在 今后 的 社交 网 络 研究 工作 中 ,需要 更 多 地 考虑 到 隐私 业务 应 用 、 隐 私 监 
管 策 略 、 用 户 隐私 安全 策略 等 问题 ,从 而 推动 社交 网 络 正常 发 展 。 


11.5 集体 智能 


集体 智能 (collective intelligence) 也 称 为 集体 智慧 或 群体 智能 ,是 一 种 共享 的 或 者 集 
体 的 智能 , 它 是 从 许多 个 体 的 合作 与 竞争 中 涌现 出 来 的 ,并 没有 集中 的 控制 机 制 。 集 体 智 
能 在 细菌 .动物 、 人 类 以 及 计算 机 网 络 中 形成 ,并 以 多 种 形式 的 协商 一 致 的 决策 模式 出 现 。 

集体 智能 的 规模 有 大 有 小 ,可 能 有 个 体 集体 智能 、 人 际 集体 智能 、 成 组 集体 智能 、 活 动 
集体 智能 、 组 织 集体 智能 、 网 络 集体 智能 、 相 邻 集体 智能 、 社 团 集体 智能 、 城 市 集体 智能 、 省 
级 集体 智能 、 国 家 集体 智能 、 区 域 集体 智能 、 国 际 组 织 集体 智能 、 全 人 类 集体 智能 等 ,这 些 
都 是 在 特定 范围 内 的 群体 所 反映 出 来 的 智慧 。 

集体 智能 的 形式 可 以 是 多 种 多 样 的 ,有 对 话 型 集体 智能 、 结 构 型 集体 智能 、 基 于 学 习 
的 进化 型 集体 智能 .基于 通信 的 信息 型 集体 智能 .思维 型 集体 智能 、 群 流 型 集体 智能 、 统 计 
型 集体 智能 .相关 型 集体 智能 。 

Tapscott 等 人 认为 ,集体 智能 是 大 规模 协作 ,为 了 实现 集体 智能 ,需要 存在 四 项 原 
则 , 即 开 放 、 对 等 .共享 以 及 全 球 行动 。 开 放 就 是 要 放松 对 资源 的 控制 ,通过 合作 让 别人 分 
享 想法 和 申请 特许 经 营 ,这 将 使 产品 获得 显著 改善 ,并 得 到 严格 检验 。 对 等 是 利用 自 组 织 
的 一 种 形式 ,对 于 某 些 任 务 来 说 , 它 可 以 比 等 级 制度 工作 得 更 有 效率 。 越 来 越 多 的 公司 已 
经 开始 意识 到 ,通过 限制 其 所 有 的 知识 产权 ,导致 他 们 关闭 了 所 有 可 能 的 机 会 。 而 分 享 一 
些 则 使 得 他 们 可 以 扩大 其 市 场 ,并 且 能 够 更 快 地 推出 产品 。 通 信和 技术 的 进步 已 经 促使 全 
球 性 公司 ,全球 一 体 化 的 公司 将 没有 地 域 限制 ,而 有 全 球 性 的 联系 ,使 他 们 能 够 获得 新 的 
市 场 、 理 念 和 技术 。 
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11.5.1 社 群 智能 


互联 网 和 社会 网 络 服务 (social network service) 正 在 快速 增长 。 各 种 内 骨 传 感 器 的 
移动 手机 大 量 涌现 ,全 球 定位 系统 (GPS) 接 收 器 在 日 常 交通 工具 中 逐步 普及 ,静态 传 感 设 
施 ( 如 WirFi\ 监 控 摄 像 头等 ) 在 城市 大 面积 部 署 , 人 类 日 常 行为 的 轨迹 和 物理 世界 的 动态 
变化 情况 正 以 前 所 未 有 的 规模 深度 和 广度 被 捕获 成 为 数字 世界 。 我 们 把 收集 来 的 各 种 
数字 轨迹 形象 地 称 为 “数字 脚印 ”(digital footprints)。 通 过 对 这 些 数字 脚印 进行 分 析 和 
处 理 ,一 个 新 兴 的 研究 领域 一 一 “ 社 群 智能 ”(social and community intelligence) 正 在 逐步 
形成 。 

社 群 智能 的 研究 目的 在 于 从 大 量 的 数字 脚印 中 挖掘 和 理解 个 人 和 群体 活动 模式 、 大 
规模 人 类 活动 和 城市 动态 规律 ,把 这 些 信 息 用 于 各 种 创新 性 的 服务 ,包括 社会 关系 管理 、 
人 类 健康 改善 ,公共 安全 维护 ,城市 资源 管理 和 环境 资源 保护 等 。 下 面 以 “智慧 校园 ”为 
例 ,说 明 社 群 智 能 给 我 们 的 工作 和 生活 带 来 的 影响 。 在 大 学 校园 里 ,学 生 A 经 常会 遇 到 
一 些 困扰 : 当 他 想 去 打球 时 ,不 知道 谁 有 时 间 能 陪 他 去 玩 ; 要 去 上 自习 时 ,不 知道 在 哪个 
教学 楼 里 可 以 找到 空位 。 另 外 ,作为 人 口 密集 场所 , 当 严 重 流感 (如 HIN1) 来 袭 时 ,如 何 
寻求 有 效 办 法 限制 其 传播 ? 当 确 定 B 患 上 某 疑 似 病 例 后 ,需要 及 时 地 把 最 近 接 触 过 BB 的 
人 找到 。 在 现 有 条 件 下 ,获取 这 些 有 关 个 人 活动 情境 、 空 间 动 态 、 人 际 交 互 的 信息 还 没有 
较 好 的 技术 解决 方案 , 须 依赖 耗 时 且 易 出 错 的 人 工 查询 来 完成 。 例 如 ,A 需要 通过 电话 
或 网 上 通信 方式 和 多 个 朋友 联系 ,确定 谁 可 以 一 起 去 打球 。 社 群 智能 的 出 现 将 改变 这 一 
切 。 上 面 提 到 的 问题 都 可 以 通过 分 析 来 自 校园 的 静态 传 感 设施 和 移动 电话 感知 数据 ( 蓝 
牙 ,加 速度 传感器 等 ) 以 及 发 布 在 社会 万 维 网 (Web) 上 的 人 与 人 之 间 的 关系 信息 解决 。 以 
流感 防 控 问题 为 例 ,记录 谁 和 B 接触 过 、 接 触 时 的 距离 以 及 时 间 长 短 . 社 会 关系 (如 亲戚 、 
朋友 或 陌生 人 ) 等 是 非常 重要 的 ,这 些 信息 可 以 通过 分 析 移 动 电话 感 知 数据 得 到 。 

社 群 智能 是 在 社会 计算 (social computing) ,城市 计算 (urban computing) 和 现实 世界 
挖掘 Creality mining) 等 相关 领域 发 展 基础 上 提出 来 的 。 从 宏观 角度 讲 , 它 隶属 于 社会 感 
知 计算 (socially-aware computing) 范 畴 。 社 会 感知 计算 是 通过 人 类 生活 空间 逐步 大 规模 
部 署 的 多 种 类 传 感 设备 ,实时 感知 识别 社会 个 体 行为 ,分 析 挖 掘 群 体 社 会 交互 特征 和 规 
律 , 辅 助 个 体 社会 行为 ,支持 社 群 的 互动 .沟通 和 协作 。 社 群 智能 主要 侧重 于 智能 信息 挖 
掘 ,具体 功能 包括 : 多 数据 源 融 合 , 即 要 实现 多 个 多 模 态 、 异 构 数 据 源 的 融合 。 综 合 利 
用 3 类 数据 源 : 互联 网 与 万 维 网 应 用 .静态 传 感 设施 (static sensing infrastructure) ,移动 
及 可 携带 (wearable) 感 知 设备 ,挖掘 “智能 信息 ; @ 分 层次 智能 信息 提取 ,利用 数据 挖掘 
和 机 器 学 习 等 技术 从 大 规模 感知 数据 中 提取 多 层次 的 智能 信息 : 在 个 体 (individual) 级 别 
识别 个 人 情境 (context) 信 息 ,在 群体 (group) 级 别提 取 和 群体 活动 及 人 际 交 互信 息 , 在 社会 
(social or community) 级 别 挖掘 人 类 行为 模式 、 社 会 及 城市 动态 变化 规律 等 信息 。 

社 群 智能 为 开发 一 系列 创新 性 的 应 用 提供 了 可 能 。 从 用 户 角度 看 , 它 可 以 开发 各 种 
社会 关系 网 络 服务 促进 人 与 人 之 间 的 交流 。 从 社会 和 城市 管理 角度 看 , 它 可 以 实时 感知 
现实 世界 的 变化 情况 ,为 城市 管理 .公共 卫生 、 环 境 监测 等 多 个 领域 提供 智能 决策 支持 。 
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11.5.2 集体 智能 系统 


集体 智能 系统 一 般 是 复杂 的 大 系统 ,甚至 是 复杂 的 巨 系统 。20 世纪 90 年 代 , 钱 学 森 
提出 了 开放 的 复杂 巨 系 统 (Open Complex Giant System，OCGS) 的 概念 ,并 提出 从 定性 
到 定量 的 综合 集成 法 作为 处 理 开放 的 复杂 巨 系统 的 方法 论 , 着 眼 于 人 的 智慧 与 计算 机 的 
高 性 能 两 者 结合 ,以 思维 科学 ( 认 知 科学 ) 与 人 工 智能 为 基础 ,用 信息 技术 和 网 络 技术 构建 
综合 集成 研讨 厅 (hall for workshop of metasynthetic engineering) 的 体系 ,以 可 操作 平台 
的 方式 处 理 与 开放 的 复杂 巨 系 统 相 联系 的 复杂 问题 。 随 着 互联 网 的 广泛 普及 ,这 种 综合 
集成 研讨 厅 就 可 以 是 以 互联 网 为 基础 的 集体 智能 系统 。 

20 世纪 90 年 代 以 来 ,多 Agent 系统 迅速 发 展 ,为 构建 大 型 复杂 系统 提供 良好 的 技术 
途径 。 史 忠 植 等 人 将 智能 Agent 技术 和 网 格 结构 有 机 结合 起 来 ,研制 了 Agent 网 格 智能 
平台 (Agent Grid Intelligence Platform,AGrIP)。AGrIP 由 底层 集成 平台 MAGE、 中 间 
软件 层 和 应 用 层 构成 (图 11-8)。 该 软件 创建 协同 工作 环境 ,提供 知识 共享 和 互 操作 ,成 
为 开发 大 规模 复杂 的 集成 智能 系统 良好 的 工具 。AGrIP 主要 的 功能 特点 如 下 。 
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图 11-8 Agent 网 格 智能 平台 


(1) 开放 性 : 面向 服务 AGrIP 提供 开放 式 平台 ,而 不 是 一 个 工具 集 , 使 得 任何 一 个 应 
用 都 可 以 把 “智能 ?嵌入 到 它 的 核心 功能 中 ,或 者 嵌入 到 任何 一 个 分 析 工 具 和 Agent 网 格 
的 接口 中 ,提供 使 用 系统 工具 和 外 部 应 用 的 无 缝 集成 模式 。 
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(2) 自主 性 : Agent 是 一 个 粒度 大 智能 性 高 .具有 自主 性 的 软件 实体 。 

(3) 协同 性 : AGrIP 支持 多 组 织 群 体 协 同 完成 一 个 任务 ,系统 中 角色 动态 化 流程 柔 
性 化 、 表 单 多 样 化 ,具有 面向 服务 的 .灵活 的 数据 接口 ,提供 协同 工作 的 环境 。 

(4) 可 复 用 : AGrIP 为 软件 复 用 提供 了 有 效 途 径 , 利 用 粒度 大 、 功 能 强 的 可 视 化 
Agent 开发 环境 VAStudio 开发 应 用 系统 ,可 以 提高 应 用 软件 的 开发 效率 ,支持 应 用 系统 
集成 ,可 伸缩 性 好 ,提高 软件 可 靠 性 ,有 效 缩短 开发 时 间 及 降低 成 本 。 

(5) 分 布 性 : AGrIP 分 布 式 计 算 平 台 构 建 在 Java RMI 之 上 ,隐藏 底层 实现 细节 , 呈 
现 给 用 户 的 是 统一 的 分 布 式 计算 环境 。 

(6) 智能 性 : AGrIP 提供 多 种 智能 软件 ,包括 多 策略 知识 挖掘 软件 MSMiner、 专 家 系 
统 工具 OKPS、 知 识 管理 系统 KMSpher、 案 例 推理 工具 CBRS、 多 媒体 信息 检索 软件 
MIRES 等 ,全 面 支持 智能 应 用 系统 的 开发 。 


11.5.3 全 球 脑 


人 脑 是 由 神经 网 络 (硬件 ) 和 心智 系统 (软件 ) 构 成 的 智能 系统 。 互 联网 已 成 为 人 们 共 
享 全 球 信息 的 基础 设施 。 在 互联 网 的 基础 上 通过 全 球 心智 模型 (World Wide Mind， 
WWM) 就 可 实现 全 球 脑 (World Wide Brain, WWB)。 

全 球 心智 模型 如 图 11-9 所 示 , 它 由 心智 模型 (CAM) 和 万 维 网 构成 。CAM 分 为 记 
忆 、 意 识 、 高 级 认 知 功能 3 个 层次 。 在 CAM 中 ,按照 信息 记忆 的 持续 时 间 长 短 ,记忆 包含 
3 种 类 型 : 长 时 记忆 、 短 时 记忆 和 工作 记忆 。 记 忆 的 功能 是 保存 各 种 类 型 的 信息 。 长 时 
记忆 中 保存 抽象 的 知识 ,如 概念 ,行为 .事件 等 ; 短 时 记忆 存储 当前 世界 (环境 ) 的 知识 或 信 
念 ,以 及 系统 拟 实现 的 目标 或 子 目 标 ;工作 记忆 存储 了 一 组 从 感知 器 获得 的 信息 ,如 照相 
机 拍摄 的 视觉 信息 .从 GPS 获得 的 特定 信息 。 这 些 记 忆 的 信息 用 于 支持 CAM 的 认 知 
活动 。 
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图 11-9 ”全球 心智 模型 


意识 是 采用 有 限 状态 自动 机 建 模 , 它 对 应 于 人 的 心理 状态 ,如 快乐 ,愤怒 、 伤 心 等 。 为 
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了 模拟 人 类 决策 过 程 的 心智 状态 ,CAM 中 利用 状态 的 效用 函数 ,赋予 每 个 状态 执行 的 优 
先 值 。 

高 级 认 知 功能 部 分 包括 事件 检测 行动 规划 等 。 这些 高 级 认 知 功能 的 执行 由 CAM 
的 记忆 与 意识 的 组 件 提供 了 基本 的 认 知 动作 ,通过 服务 动作 序列 实现 。 

互联 网 通过 语义 互联 ,计算 机 能 读 懂 网 页 的 内 容 , 在 理解 的 基础 上 支持 用 户 的 互 操 
作 。 这 种 互 操作 性 是 通过 语义 保证 的 ,而 互 操作 的 环境 是 异 质 动态 、 开 放 、 全 球 化 的 
Web。 这 样 就 可 以 通过 互联 网 语义 互联 ,将 人 脑 扩 展 成 为 全 球 脑 ,拥有 全 球 丰 富 的 信息 和 
知识 资源 ,为 科学 决策 提供 强大 的 支持 。 


11.5.4 互联 网 大 脑 ( 云 脑 ) 


互联 网 极 大 地 增强 了 人 类 的 智慧 ,丰富 了 人 类 的 知识 。 而 智慧 和 知识 恰恰 与 大 脑 的 
关系 最 密切 。 从 21 世纪 开始 , 随 着 人 工 智 能 、 物 联网 、 大 数据 、 云 计算 、 机 器 人 、 虚 拟 现 实 、 
工业 互联 网 等 科学 技术 的 蓬勃 发 展 ,互联 网 类 脑 架 构 也 逐步 清晰 起 来 。 

2008 年 开始 ,科学 院 研 究 团队 在 中 国 科技 论文 在 线 发 表 论 文 (互联 网 进化 规律 的 发 
现 与 分 析 》, 第 一 次 提出 “互联 网 正在 向 着 与 人 类 大 脑 高 度 相似 的 方向 进化 , 它 将 具备 自己 
的 视觉 .听觉 .触觉 .运动 神经 系统 ,也 会 拥有 自己 的 神经 元 网 络 .记忆 神经 系统 .中 枢 神经 
系统 .自主 神经 系统 ”。 并 由 此 绘制 互联 网 大 脑 架 构 , 如 图 11-10 所 示 。2015 年 ,研究 团 
队 基于 互联 网 大 脑 架构 将 智慧 城市 与 脑 科 学 进行 结合 ,形成 城市 云 脑 体系 。 


互联 网 大 脑 





图 11-10 互联 网 大 脑 架 构 


互联 网 大 脑 ( 云 脑 ) 理 论 的 核心 架构 包括 互联 网 中 枢 神 经 系统 、 视 觉 神经 系统 、 听 觉 神 
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经 系统 、 颈 体感 觉 神经 系统 、 运 动 神经 系统 .类 脑 神经 元 网 络 和 云 反 射 弧 。 下 面 介绍 类 脑 
神经 元 网 络 和 云 反 射 弧 。 

1. 类 脑 神经 元 网 络 

互联 网 的 类 脑 神经 元 网 络 是 由 社交 网 络 发 育 而 成 的 ,一 直 以 来 ,社交 网 络 被 认为 是 互 
联网 上 人 与 人 的 交互 社区 。 但 随 着物 联 网 、 云 计算 、 大 数据 等 新 现象 的 出 现 ,社交 网 络 的 
形态 也 必 将 发 生 改变 。 当 物 联网 、 工 业 4.0、 工 业 互 联网 与 社交 网 络 融 合 时 ,每 一 栋 大 楼 、 
每 一 辆 汽车 ,每 一 个 景区 、 每 一 个 商场 ,每 一 个 电器 都 会 在 SNS 网 站 上 开设 账号 ,自动 地 
发 布 自己 实时 的 信息 ,并 与 其 他 人 ”和 *“ 物 ”进行 交互 。 社 交 网络 的 定义 将 不 再 仅仅 是 人 
与 人 的 社交 ,而 是 人 与 人 、 人 与 物 、 物 与 物 的 范围 更 大 的 社交 网 络 , 可 以 称 为 “大 社交 网 络 ” 
(Big SNS) ,如 图 11-11 所 示 。 

大 社交 网 络 是 互联 网 类 脑 神经 元 的 重要 基础 ,世界 范围 的 个 人 用 户 \ 企 业 、 政 府 机 构 、 
路 灯 、 车 辆 \ 工 场 ,都 要 以 互联 网 神经 元 的 方式 加 入 到 互联 网 (城市 ) 云 脑 神经 元 网 络 中 ,这 
些 互联 网 神经 元 的 互动 .聚合 \、 链 接 将 使 互联 网 或 智慧 城市 真正 变 得 更 智慧 , 它 也 是 云 反 
射 弧 能 够 正常 运转 的 基础 。 
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图 11-11 类 脑 神经 元 网 络 (大 社交 ) 


2. 云 反射 弧 

神经 反射 现象 是 人 类 神经 系统 最 重要 的 神经 活动 之 一 ,也 是 生命 体 智能 的 重要 体现 。 
与 人 体 的 神经 反射 弧 相 对 应 ,互联 网 云 神经 反射 弧 主 要 由 如 下 3 个 方面 构成 : 云 反射 
弧 的 感受 器 主要 由 联网 的 传感器 (包括 摄像 头 ) 组 成 ; @ 云 反射 弧 的 效应 器 主要 由 联网 的 
办 公设 备 、 智 能 制造 智能 驾驶 、 智 能 医疗 等 组 成 ; 回 云 反射 弧 的 中 枢 神经 是 互联 网 云 脑 
的 中 枢 神 经 系统 ( 云 计算 十 大 数据 十 人 工 智 能 ) ,边缘 计算 将 加 强 云 反射 弧 感受 器 和 效应 
器 的 智能 程度 和 反应 速度 。 

云 神经 反射 弧 作 为 互联 网 与 人 工 智 能 结合 的 产物 ,在 互联 网 的 未 来 发 展 中 将 起 到 非 
常 重要 的 作用 。 从 实践 上 看 ,有 9 种 不 同 种 类 的 云 反 射 弧 ( 图 11-12) ,这些 云 反射 弧 的 成 
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熟 依赖 于 互联 网 与 人 工 智能 技术 的 进一步 结合 。 


互联 网 云 脑 - 云 反射 缴 架 构 
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图 11-12 云 反射 弧 


云 反 射 弧 的 建设 反映 出 互联 网 和 城市 在 提供 各 种 智慧 相关 服务 ,处理 各 种 问题 过 程 
中 的 种 类 和 反应 速度 。 云 反射 弧 的 种 类 越 多 ,反应 速度 越 快 ,其 智慧 程度 也 会 越 高 。 例 
如 ,包括 安防 云 反 射 弧 、 金 融 云 反射 弧 、 交 通 云 反 射 弧 、 能 源 云 反射 弧 、 教 育 云 反 射 弧 、 医 疗 
云 反 射 弧 、 旅 游 去 反射 弧 、 零 售 云 反射 弧 等 。 

2017 年 12 月 20 日 ,阿里 的 专家 在 阿里 云云 柄 大 会 上 介绍 了 阿里 云 人 工 智能 “ET 大 
脑 ”。2016 年 ,阿里 云 发 布 了 人 工 智能 ET, 整合 了 阿里 巴巴 的 语音 、 图 像 、 人 脸 、 自 然 语言 
理解 等 能 力 ,被 定位 为 全 球 首 个 类 脑 架 构 AI。2017 年 ,阿里 云 将 ET 从 单 点 的 技能 升级 
为 具备 全 局 智能 的 ET 大 脑 。 阿 里 云 ET 大 脑 将 AI 技术 ` 云 计算 大 数据 能 力 与 垂直 领域 
行业 知识 相 结合 ,基于 类 脑 神 经 元 网 络 物理 架构 及 模糊 认 知 反 演 理论 ,实现 从 单 点 智能 到 
多 体 智能 的 技术 跨越 ,打造 出 具备 多 维 感知 、 全 局 洞察 ,实时 决策 ,持续 进 化 等 类 脑 认 知 能 
力 的 超级 智能 体 。 

谷歌 大 脑 成 为 包括 视觉 识别 .语言 翻译 ,文字 识别 .语音 识别 的 互联 网 AI 系统 ,谷歌 
无 人 鸭 驶 汽车 谷歌 眼镜 也 能 通过 使 用 谷歌 大 脑 性 能 提升 ,可 以 更 好 地 感知 真实 世界 中 的 
数据 。 

百度 大 脑 包 括 语音 识别 .OCR、 人 脸 识 别 、 知 识 图 谱 、 自 然 语 言 理 解 . 用 户 画 像 等 各 种 
各 样 的 能 力 , 到 2017 年 开放 了 80 多 项 百度 大 脑 的 能 力 或 API, 有 37 万 多 名 开发 者 在 使 
用 百度 大 脑 各 种 各 样 的 能 力 。 
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讯 飞 超 脑 打 造 人 工 智能 生态 在 万 物 互联 和 人 工 智能 浪潮 的 推动 下 ,面向 教育 、 客 服 和 
医疗 行业 以 及 翻译 、 汽 车 ,移动 端 和 家 庭 等 消费 者 场景 ,发 布 .升级 产品 和 解决 方案 。 


11.5.5 智联 网 


智联 网 (Internet of Minds,IoM) 正 是 实现 借助 机 器 智能 的 联结 协同 人 类 社会 中 各 种 
纷 杂 智能 体 的 核心 科技 。 只 有 在 实现 社会 化 的 智能 体 知 识 互联 之 后 ,人 工 智 能 技术 才能 
够 形成 真正 的 社会 化 生态 系统 。 本 节 参 考 了 中 科 院 王 飞跃 等 人 的 文献 。 

如 果 说 互联 网 的 实质 是 实现 “ 虚 连 ”或 被动 联 结 ”, 物 联网 的 实质 是 “ 实 连 ”或 “在 线 联 
结 ”, 则 智联 网 的 实质 是 “ 真 联 "或 “主动 联结 ”。 智 联网 是 新 智能 时 代 的 核心 科技 ,只 有 在 
智联 网 建成 之 后 , 才 可 以 宣告 智能 时 代 全 面 来 临 。 

智联 网 的 定义 : 智联 网 以 互联 网 、 物 联网 技术 为 前 序 基础 科技 ,在 此 之 上 以 知识 自动 
化 系统 为 核心 系统 ,以 知识 计算 为 核心 技术 ,以 获取 知识 .表达 知识 .交换 知识 .关联 知识 
为 关键 任务 ,进而 建立 包含 人 、 机 、 物 在 内 的 智能 实体 之 间 语 义 层次 的 联结 、 实 现 各 智能 体 
所 拥有 的 知识 之 间 的 互联 互通 ;智联 网 的 最 终 目的 是 支撑 和 完成 需要 大 规模 社会 化 协作 
的 ,特别 是 在 复杂 系统 中 需要 的 知识 功能 和 知识 服务 。 

智联 网 并 非 空中 楼 阁 , 它 是 建立 在 互联 网 (数据 信息 互联 ) 和 物 联网 (感知 控制 互 
联 ) 基 础 上 的 ,目标 是 “知识 智能 互联 ”的 系统 。 智 联网 的 目标 是 达成 智能 体 群 体 之 间 
的 “协同 知识 自动 化 ”和 “协同 认 知 智能 ”, 即 以 某 种 协同 的 方式 进行 从 原始 经 验 数据 的 
主动 采集 、 获 取 知 识 、 交 换 知识 、 关 联 知识 ,到 知识 功能 ,如 推理 .策略 、 决 策 、 规 划 、 管 控 
等 的 全 自动 化 过 程 ,因此 智联 网 的 实质 是 一 种 全 新 的 、 直 接 面 向 智能 的 复杂 协同 知识 
自动 化 系统 。 

1. 协同 认 知 智能 

以 人 体 大 脑 以 及 神经 系统 作为 比喻 ,互联 网 完成 的 是 信息 的 互联 互通 ,有 如 遍布 人 体 
的 神经 传导 和 连接 ; 物 联 网 完成 了 万 物 互联 的 信息 采集 和 驱动 控制 ,有 如 负责 反射 的 次 峰 
神经 系统 ,负责 处 理 传 感 信息 的 传 感 系统 ,负责 协调 控制 人 体 的 小 脑 、 脑 干 、 中 脑 \ 脑 中 等 
系统 ,其 功能 即 根据 环境 输入 ,协调 和 决定 控制 输出 ,属于 反应 智能 (动物 智能 )。 而 智联 
网 追求 的 是 认 知 智能 , 即 描述 智能 .预测 智能 .引导 智能 的 合 一 体 , 完 成 对 系统 在 知识 层面 
的 思考 ,自动 .自觉 地 完成 系统 高 级 知识 功能 ,如 长 短期 规划 重大 决策 .策略 制定 、 基 于 环 
境 动 态 的 适应 、 复 杂 系 统 状态 分 析 、 复 杂 系 统管 控 等 。 智 联网 \ 物 联网 、 互 联网 需要 将 高 等 
( 认 知 )、 中 等 (反应 )、 低 等 (反射 ) 智 能 通过 某 种 机 制 统 摄 到 一 起 ,类 似 于 人 体 就 是 3 种 智 
能 的 统一 体 ,形成 感知 、 认 知 、 思 维 .行动 一 体 化 的 大 智能 系统 。 

智联 网 智能 最 大 的 特征 是 实现 海量 智能 体 在 知识 层面 的 直接 连通 , 即 “ 协 同 智能 ”。 
互联 网 传输 的 是 数据 与 信息 ,实现 的 是 信息 的 协同 。 物 联网 传输 的 是 传 感 和 管控 的 数据 ， 
实现 的 是 感知 和 控制 的 协同 。 智 联网 的 智能 互联 交换 的 是 知识 本 身 , 经 过 充分 的 交互 ,在 
知识 的 交换 中 完成 复杂 知识 系统 的 建立 、 配 置 和 优化 ;同时 ,海量 的 智能 实体 组 成 由 知识 
联结 的 复杂 系统 ,依据 一 定 的 运行 规则 和 机 制 ,如 同人 类 社会 一 样 ,形成 社会 化 的 自 组 织 、 
自 运 行 、 自 优化 、 自 适应 、 自 协作 的 网 络 组 织 。 
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2. 智联 网 典型 应 用 

智联 网 意味 着 向 社会 化 的 知识 连通 、 智 能 整合 的 跃进 ;意味 着 从 相对 独立 的 简单 知识 
系统 ,向 基于 知识 联结 的 、 整 合 为 一 的 复杂 知识 系统 的 跃进 ;意味 着 从 以 “牛顿 定律 ”为 代 
表 的 精确 物质 系统 ,向 以 “ 默 顿 定律 "为 代表 的 自由 意志 系统 的 跃进 。 下 面 给 出 3 个 前 沿 
应 用 示例 。 

(1) 信息 物理 社会 系统 (Cyber-Physical-Social Systems,CPSS): 信息 和 物理 系统 被 
进一步 融会 贯通 ,形成 了 高 级 、 复 杂 的 信息 物理 系统 (CPS)。CPS 理念 广泛 应 用 于 交通 、 
能 源 、 国 防 、 制 造 、 医 疗 、 电 力 、 农 业 等 方面 。 作 为 CPS 系统 的 设计 者 、 制 造 者 、 管 理 者 和 使 
用 者 ,人 与 CPS 是 紧密 结合 在 一 起 的 ,需要 人 参与 其 中 才能 使 系统 更 高 效 、 安 全、 可 靠 地 
运行 。 在 这 其 中 ,人 与 信息 物理 系统 之 间 的 运行 模式 有 共 融 ,协同 .主导 、 辅 助 ,监管 等 , 催 
生 了 CPSS 的 诞生 和 发 展 。 目 前 的 解决 途径 与 方法 蕴涵 在 物理 空间 和 虚拟 空间 
Cyberspace 融合 的 求解 空间 中 。 下 一 步 ,关键 在 于 引入 能 提供 社会 信号 的 智能 实体 , 构 
建 专 业 和 社会 性 的 知识 网 络 , 认 知 和 感知 社会 或 企业 等 组 织 , 通 过 CPSS 实现 智慧 运营 和 
管理 。CPSS 的 知识 蕴涵 和 隐匿 在 海量 物理 和 社会 智能 实体 内 ,对 知识 的 获取 和 运用 需 
要 社会 化 的 智能 协作 ,因此 必须 借助 智能 和 知识 工程 技术 。 也 就 是 说 ,知识 自动 化 和 智联 
网 将 在 CPSS 中 发 挥 核心 的 作用 。 

(2) 软件 定义 的 流程 与 系统 : 在 工程 领域 , 越 来 越 多 的 系统 打破 常规 ,并 通过 开放 的 
软件 定义 的 系统 接口 实现 系统 功能 的 灵活 重 构 , 使 得 未 来 工程 系统 成 为 智能 实体 的 联合 
体 , 极 大 地 改善 了 系统 的 扩展 能 力 和 灵活 性 。 当 代 软 件 定义 系统 前 沿 的 代表 为 软件 定义 
网 络 (SDN) ,敏捷 虚拟 企业 (Agile Virtual Enterprise, AVE) 和 社会 制造 ( 众 包 )。 知 识 自 
动 化 和 智联 网 是 软件 定义 流程 与 系统 的 核心 : 结合 知识 表示 和 知识 工程 ,联结 智能 实体 ， 
构造 和 支撑 各 类 针对 特定 领域 和 问题 的 软件 定义 的 流程 (Software-Defined Processes， 
SDP) 和 软件 定义 的 系统 (Software-Defined Systems,SDS)。 通 过 SDP 和 SDS, 使 常识 、 
经 验 、 猜 测 ,假定 希望 .创新 ,想象 等 形式 化 和 实质 化 ,并 使 其 组 织 、 过 程 、 功 能 等 软件 化 ， 
变 为 可 操作 、 可 计算 、 可 试验 的 流程 和 系统 ,从 而 能 够 进一步 落实 复杂 知识 自动 化 系统 的 
构想 、 设 计 、 实 施 、 运 营 、 管 理 与 控制 。 

(3) 工业 智联 网 : 网 络 化 工控 系统 总 体 趋 势 是 从 简单 的 本 地 仪 控 , 慢 慢 演化 到 远程 
智能 的 复杂 系统 管控 。 当 前 的 工业 物 联 网 的 注意 力主 要 放 在 工业 网 络 的 精确 性 、 确 定性 、 
自 适应 性 、 安 全 性 等 以 工业 用 通信 为 中 心 的 研发 和 应 用 上 。 但 是 , 随 着 智能 制造 的 广度 和 
深度 进一步 发 展 ,即将 出 现 “ 软 件 定义 工业 “类 工业 领域 “广义 工业 ”社会 制造 “社会 工 
业 ” 等 智能 大 工业 新 形态 ,而 智联 网 将 在 该 发 展 过 程 中 起 决定 性 作用 。 工 业 智 联网 的 诞生 
将 会 以 极 高 的 效率 整合 各 种 工业 和 社会 资源 ,减少 工业 过 程 中 的 浪费 和 消耗 ,解放 工业 生 
产 力 ,并 促进 智能 大 工业 的 出 现 和 高 速 发 展 。 

在 社会 的 各 种 行业 和 产业 中 ,其 应 用 还 包括 农业 智联 网 、 能 源 智联 网 、 医 疗 智联 网 、 教 
育 智联 网 、 各 种 社会 管理 和 服务 智联 网 等 。 

3. 核心 问题 和 关键 平台 技术 

智联 网 的 核心 问题 : 知识 的 获取 : 一 般 性 知识 自动 化 系统 从 感性 混杂 数据 中 获取 
经 验 知 识 ; @ 知 识 的 协同 表征 和 传递 : 智联 网 协同 知识 表征 ,人 工 语 言 系统 的 建立 ; @ 知 
识 的 关联 和 协同 运行 : 从 知识 动力 学 的 观点 定义 知识 关联 ,以 及 基于 知识 关联 的 知识 协 
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同 运行 方式 。 

智联 网 的 关键 平台 技术 : 虚实 平行 系统 平台 实现 智联 网 的 管控 和 知识 空间 的 管控 ; 
基于 互联 网 \ 物 联网 、 区 块 链 和 平行 网 络 的 社会 化 通信 计算 基础 平台 ,为 分 布 式 、 自 组 织 、 
自 运行 的 安全 智联 网 系统 提供 基础 设施 。 


11.5.6 案例 : 智能 网 联 汽车 


智能 网 联 汽 车 是 指 搭载 先进 的 车 载 传感器 .控制 器 .执行 器 等 装置 ,并 融合 现代 通信 
与 网 络 技术 ,实现 车 与 XI 人 、 车 .路 ` 云 端 等 ) 智 能 信息 交换 .共享 ,具备 复杂 环境 感知 、 智 
能 决策 .协同 控制 等 功能 ,可 实现 * 安 全 高效、 和 舒适、 节能” 行驶, 最终 可 实现 奉 代 人 操作 的 
新 一 代 汽 车 。 

智能 网 联 标准 体系 中 ,智能 控制 主要 指 车 辆 行驶 过 程 中 横向 (方向 ) 控 制 和 纵向 ( 速 
度 ) 控 制 及 其 组 合 对 车 辆 行驶 状态 的 调整 和 控制 ,涉及 发 动机 、 变 速 器 、 制 动 . 底 盘 等 多 个 
系统 。 根 据 车 辆 智能 控制 的 复杂 程度 .自动 化 水 平和 适应 工 况 不 同 ,又 可 分 为 辅助 控制 和 
自动 控制 两 类 。 

辅助 控制 类 标准 覆盖 车 辆 静止 状态 下 的 动力 传动 系统 控制 ,车 辆 行驶 状态 下 的 横向 
(方向 ) 控 制 和 纵向 (速度 ) 控 制 , 以 及 整 车 和 系统 层面 的 功能 、 性 能 要 求 和 试验 方法 。 

自动 控制 类 标准 则 以 城市 道路 、 公 路 等 不 同道 路 条 件 以 及 交通 拥堵 .事故 避让 、 倒 车 
等 不 同 工 况 下 的 应 用 场景 为 基础 ,提出 车 辆 功能 要 求 以 及 相应 的 评价 方法 和 指标 。 

智能 网 联 汽车 技术 的 两 条 他 辑 主线 是 “信息 感知 ”和 “决策 控制 ”, 其 发 展 的 核心 是 由 
系统 进行 信息 感知 ,决策 预警 和 智能 控制 ,逐渐 替代 驾驶 员 的 驾驶 任务 ,并 最 终 完全 自主 
执行 全 部 驾驶 任务 。 

1. 信息 感知 

根据 信息 对 驾驶 行为 的 影响 和 相互 关系 ,信息 感知 分 为 “驾驶 相关 类 ”和 * 非 驾驶 相关 
类 ”。 驾 驶 相关 类 信息 包括 传 感 探测 类 和 决策 预警 类 ,如 图 11-13 所 示 。 非 驾驶 相关 类 信 
息 主要 包括 车 载 娱 乐 服务 和 车 载 互联 网 信息 服务 。 

传 感 探测 类 又 可 根据 信息 获取 方式 进一步 细 分 为 依靠 车 辆 自身 传感器 直接 探测 所 获 
取 的 信息 (自身 探测 ) 和 车 辆 通过 车 载 通信 装置 从 外 部 其 他 结 点 接受 的 信息 (信息 交互 ) 。 

“智能 化 十 网 联 化 ” 相 融 合 可 以 使 车 辆 在 自身 传感器 直接 探测 的 基础 上 ,通过 与 外 部 
结 点 的 信息 交互 ,实现 更 加 全 面 的 环境 感知 ,从 而 更 好 地 支持 车 辆 进行 决策 和 控制 。 

2. 决策 控制 

根据 车 辆 和 驾驶 员 在 车 辆 控制 方面 的 作用 和 职责 ,决策 控制 分 为 “辅助 控制 类 ”和 “ 自 
动 控 制 类 ”, 分 别 对 应 不 同等 级 的 决策 控制 ,如 图 11-13 所 示 。 

辅助 控制 类 主要 指 车 辆 利用 各 类 电子 技术 辅助 驾驶 员 进 行车 辆 控制 ,如 横向 控制 和 
纵向 控制 及 其 组 合 ,可 分 为 驾驶 辅助 (DA) 和 部 分 自动 驾驶 (PA)。 

自动 控制 类 则 根据 车 辆 自主 控制 以 及 替代 人 进行 驾驶 的 场景 和 条 件 进 一 步 细 分 为 有 
条 件 自动 驾驶 (CA) 、 高 度 自动 驾驶 (HA) 和 完全 自动 驾驶 (FA)。 

相关 《指南 ?中 的 具体 目标 如 下 : 到 2020 年 ,初步 建立 能 够 支撑 辅助 驾驶 及 低级 别 自 
动 驾驶 的 智能 网 联 汽 车 标准 体系 ;到 2025 年 ,系统 形成 能 够 支撑 高 级 别 自动 驾驶 的 智能 


名 11 竟 互联 网 和 能 一 569 一 一 





图 11-13 驾驶 相关 类 信息 


网 联 汽车 标准 体系 。 
(本 节 参 考 了 工信部 、 国 家 标准 委 共 同 制定 的 (国家 车 联网 产业 标准 体系 建设 指南 》， 
2017 年 12 月 ) 


11.5.7 案例 : 城市 计算 


城市 计算 是 一 个 交叉 学 科 , 是 计算 机 科学 以 城市 为 背景 ,与 城市 规划 、 交 通 、 能 源 、 环 
境 \ 社 会 学 和 经 济 学 等 学 科 融 合 的 新 兴 领 域 。 具 体 而 言 .城市 计算 是 一 个 通过 不 断 获 取 、 
整合 和 分 析 城 市 中 多 源 异 构 的 大 数据 解决 城市 面临 的 挑战 的 过 程 。 城 市 计算 将 无 处 不 在 
的 感知 技术 ,高 效 的 数据 管理 和 强大 的 机 器 学 习 算 法 ,以 及 新 颖 的 可 视 化 技术 相 结合 ， 
力 于 提高 人 们 的 生活 品质 ,保护 环境 和 促进 城市 运转 效率 ,帮助 我 们 理解 各 种 城市 现象 的 
本 质 , 甚 至 预测 城市 的 未 来 。 

城市 计算 的 基本 框架 如 图 11-14 所 示 , 包 括 城市 感知 及 数据 采集 数据 管理 城市 数 
据 分 析 、 服 务 提供 4 个 环节 ; 在 城市 感知 层面 ,可 以 通过 车 载 GPS 或 用 户 的 智能 手机 
产生 的 轨迹 数据 不 断 感知 司机 在 道路 上 的 驾驶 状态 ,也 可 以 收集 用 户 发 布 在 社交 媒体 上 
的 信息 。@ 在 数据 管理 层面 ,通过 时 空 索 引 结构 把 司机 产生 的 大 规模 轨迹 和 社交 媒体 数 
据 高 效 地 组 织 和 管理 起 来 ,以 供 后 续 实 时 分 析 和 挖掘。 外 在 城市 数据 分 析 层 面 , 当 城市 出 
现 异常 时 ,我 们 可 以 根据 这 些 轨 迹 数 据 较 准确 地 确定 异常 发 生 的 空间 范围 和 时 间 区 间 。 
因为 当 异 常 发 生 后 ,各 条 道路 上 的 车 流量 以 及 人 们 选择 的 行车 路 线 都 会 发 生 改 变 , 所 以 我 
们 可 以 有 针对 性 地 利用 与 这 些 地 方 及 时 间 段 相关 联 的 (而 不 是 全 部 ) 社 交 媒 体 分 析 异 常 出 
现 的 起 因 。@ 在 服务 提供 层面 ,这 些 信息 会 被 及 时 地 传递 到 交通 管理 部 门 和 周边 通行 的 
人 群 ,以 快速 处 理 异 常 ,并 避免 更 多 的 人 陷入 混乱 。 
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图 11-14 ”城市 计算 的 基本 框架 


按照 时 效 性 ,城市 计算 的 服务 可 以 分 为 厘清 现状 、 预 测 未 来 .洞察 历史 3 种 类 型 。 以 
空气 污染 为 例 , 根 据 有 限 的 空气 质量 监控 站 点 ,结合 气象 ,交通 等 其 他 数据 源 计 算 整 个 城 
市 任意 角落 的 空气 质量 ,此 为 厘清 现状 。 对 未 来 两 天 空气 质量 的 估计 ,为 预测 未 来 。 根 据 
多 年 历史 数据 分 析出 污染 物 的 来 源 和 成 因 , 为 洞察 历史 。 

按照 服务 的 行业 划分 ,城市 计算 涵盖 城市 交通 和 规划 、 城 市 环境 、 城 市 能 源 、 城 市 商 
业 \、 公 共 安 全 ,教育 .医疗 .社交 和 娱乐 等 。 

在 服务 提供 层面 ,我 们 面临 3 个 方面 的 挑战 : 融合 行业 知识 和 数据 科学 ;系统 对 接 ， 
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培养 数据 科学 家 。 针 对 这 些 挑战 ,需要 具备 4 方面 的 知识 : 大 数据 人工 智能 、 云 计算 和 
行业 知识 。 要 让 城市 计算 的 技术 落地 ,还 需要 搭建 一 个 城市 大 数据 平台 。 该 平台 可 以 基 
于 传统 的 云 计 算 平台 搭建 ,但 是 ,要 增加 对 时 空 数据 的 有 效 管 理 机 制 (如 时 空 索引 、 混 合式 
索引 以 及 这 些 索引 与 分 布 式 系统 的 结合 ) ,以 及 针对 时 空 数据 特有 的 人 工 智 能 算法 。 基 于 
这 样 的 城市 大 数据 平台 ,可 以 组 合 各 个 层面 的 模块 快速 搭建 各 种 垂直 应 用 ,在 保证 平台 可 
扩展 性 的 前 提 下 提供 高 效 、 稳 定 的 服务 。 

(本 节 参 考 了 郑 宇 的 文章 (城市 计算 : 用 大 数据 和 AI 驱动 智能 城市 )5) 


11.6 小 结 


2016 年 ,万 维 网 的 发 明 人 蒂 姆 ， 伯 纳 斯 - 李 (Tim Berners-Lee, 也 称 Tim) 获 图 灵 奖 。 
在 过 去 近 30 年 的 工作 里 ,他 的 贡献 包括 互联 的 文档 (1989 一 1999 年 )、 互 联 的 知识 
(1999 一 2009 年 ) .互联 的 社会 (2009 年 至 今 ) 。 

群体 智能 是 指 能 够 在 网 上 把 大 家 的 智慧 和 计算 机 的 智慧 组 合 在 一 起 ,建立 各 种 平台 ， 
完成 各 种 行为 。 一 些 来 自 有 关 计 算 智能 的 方案 开始 在 网 络 应 用 中 出 现 ,例如 : 

(1) 推荐 系统 。 推 荐 系统 通过 学 习 用 户 的 偏好 给 出 信息 源 、 产 品 和 服务 的 建议 。 

(2) 与 情 分 析 。 互 联网 技术 为 与 情 分 析 提 供 了 全 新 的 技术 路 线 , 通 过 对 各 种 社会 媒 
体 的 跟踪 与 挖掘 ,结合 传统 的 与 论 分 析 理 论 ,可 以 有 效 地 观察 社会 的 状态 ,并 能 辅助 决策 ， 
及 时 发 出 预警 。 

(3) 基于 内 容 的 人 际 关系 挖掘 。 互 联网 中 蕴涵 着 大 量 公 开 的 人 名 实体 和 人 际 关系 信 
息 。 利 用 文本 信息 抽取 技术 可 以 自动 抽取 人 名 ,识别 重 名 ,自动 计算 出 人 物 之 间 的 关系 ， 
进而 找 出 关系 描述 词 ,形成 一 个 互联 网 世界 的 社会 关系 网 。 微 软 亚洲 研究 院 的 “人 立方 ” 
就 是 一 个 典型 系统 。 

(4) 情境 感知 服务 。 物 联网 技术 可 以 将 现实 世界 和 信息 世界 进行 覆盖 与 融合 ,为 信 
息 采 集 、 传 递 和 服务 决策 提供 强 有 力 的 技术 支撑 。 情 境 是 指 能 够 表征 一 个 实体 的 活动 的 
信息 。 情 境 信息 包括 与 系统 功能 和 用 户 行为 密切 相关 的 各 种 信息 ,如 用 户 的 基本 资料 .位 
置 .时 间 、 自 然 环 境 、 计 算 环 境 等。 通过 情境 信息 可 以 对 当前 进行 的 活动 给 出 一 个 综合 判 
断 。 情 境 感知 服务 是 指 根据 服务 对 象 所 处 情境 的 变化 为 其 提供 准确 的 服务 。 情 境 感知 服 
务 可 以 广泛 应 用 于 现代 服务 的 各 个 行业 .如 智能 家 居 、 智 慧 城市 .智能 交通 、 智 能 旅游 等 ， 
为 人 类 的 生产 、 生 活 带 来 便利 ,实现 智慧 生活 。 

人 工 智能 已 经 走 到 2.0 时 代 一 一 基于 重大 变化 的 信息 新 环境 ,发 展 新 目标 的 新 一 代 
的 人 工 智能 。 其 中 ,信息 新 环境 是 指 互联 网 与 移动 网 的 普及 、 传 感 网 的 渗透 ,大 数据 的 涌 
现 和 网 上 社区 的 崛起 等 。 新 目标 是 指 智能 城市 .智能 经 济 、 智 能 制造 .智能 医疗 .智能 家 
居 、 智 能 驾驶 等 从 宏观 到 微观 的 智能 化 新 领域 。 

随 着 感知 技术 和 计算 环境 的 成 熟 , 各 种 大 数据 在 城市 里 悄然 而 生 , 如 交通 流 、 气 象 数 
据 、 道 路 网 、 兴 趣 点 ,移动 轨迹 和 社交 媒体 等 。 同 时 ,人 工 智能 (尤其 是 机 器 学 习 ) 算 法 的 成 
熟 也 为 数据 分 析 提 供 了 利器 。 大 数据 、 云 计算 和 人 工 智能 的 飞速 发 展 推动 了 新 型 智慧 城 
市 的 发 展 进程 。 城 市 计算 通过 对 多 源 异 构 数据 的 整合 分析 和 挖掘 ,提取 知识 和 智能 ,并 
结合 行业 知识 创造 “人 -环境 -城市 ?三 赢 的 局 面 。 城 市 计算 强调 用 大 数据 和 人 工 智能 实 实 
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在 在 地 解决 城市 面临 的 各 种 具体 问题 。 它 关系 到 人 类 未 来 的 生活 质量 和 可 持续 发 展 ,也 
是 我 国 未 来 人 工 智 能 发 展 的 抓 手 和 战略 制高点 。 


习题 
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什么 是 本 体 ? 本 体 表示 知识 的 特点 是 什么 ? 
请 举例 说 明 RDF 的 格式 。RDF Schema 的 含义 是 什么 ? 
OWL 有 哪儿 种 类 型 ? 请 说 明 它 与 XML、RDF 的 关系 。 
设计 本 体 的 基本 准则 是 什么 ? 给 出 构建 本 体 的 基本 步骤 及 其 要 点 。 
请 构建 从 网 页 获取 本 体 的 系统 。 
请 构建 从 关系 数据 库 获 取 本 体 的 系统 。 
什么 是 本 体 知 识 管理 ? 本体 知识 管理 的 基本 功能 是 什么 ? 
试 比较 Protégé 和 KAON 的 异同 和 优 缺 点 。 
分 别 以 Cyc 和 e-Science 为 例 ,说 明 构 建 大 规模 知识 系统 的 途径 。 
请 抑 要 说 明 搜索 引 车 的 工作 流程 。 
请 给 出 Web 技术 演化 过 程 ,比较 各 种 Web 类 型 的 主要 特点 。 
试 从 方法 论 和 技术 途径 说 明 如 何 实现 集体 智能 系统 。 
请 给 出 心智 模型 CAM 的 系统 结构 ,说明 各 部 分 的 主要 功能 。 
如 何 构建 全 球 脑 ? 它 的 现实 意义 是 什么 ? 
互联 网 大 脑 与 智联 网 有 何 区 别 和 联系 ? 
(思考 题 )Elsevier 的 横向 信息 产品 搜索 。Elsevier 是 一 家 居于 领先 地 位 的 科技 出 
版 商 。 它 的 产品 和 众多 竞争 者 一 样 ,主要 是 按照 传统 的 刊物 订阅 的 形式 组 织 的 。 
这 些 刊物 的 在 线 可 获得 性 目前 尚未 真正 改变 生产 线 的 组 织 方式 。 虽 然 作 者 的 个 
人 论文 可 以 在 网 络 上 在 线 获得 ,但 只 能 以 它们 在 刊物 上 登载 的 形式 ,而 文集 则 是 
按照 刊登 论文 的 刊物 组 织 的 。Elsevier 的 用 户 可 以 订阅 在 线 内 容 , 但 这 种 订阅 仍 
然 按照 传统 生产 线 的 方式 ,组 织 成 一 本 本 刊物 或 刊物 合 订 本 的 形式 。 
这 些 传统 刊物 可 以 用 纵向 信息 产品 (vertical information product) 一 词 描述 : 产 
品 分 成 许多 相互 分 离 的 门类 (如 生物 类 、 化 学 类 、 医 药 类 等 ) ,每 个 产品 仅 涉及 其 中 
一 个 门类 的 内 容 ( 其 实 往往 只 是 一 个 门类 中 的 一 部 分 内 容 ) 。 可 是 , 随 着 各 个 学 科 
(信息 科学 .生命 科学 ,物理 学 等 ) 的 迅猛 发 展 , 这 种 不 同 杂 志 互 不 相干 地 分 别 覆 盖 
不 同学 科 的 传统 做 法 已 经 不 再 令 人 满意 。Elsevier 的 用 户 感 兴趣 的 是 跨越 多 个 
传统 学 科 的 主题 领域 。 例 如 ,一 家 制药 公司 可 能 要 购买 Elsevier 的 全 部 有 关 阿 尔 
菊 海 默 症 (Alzheimer's disease) 的 科研 资料 ,而 不 关心 这 些 资料 是 来 自生 物 学 刊 
物 医 学 刊物 ,还 是 化 学 刊物 。 这 种 情况 下 所 需求 的 是 所 谓 的 横向 信息 产品 , 即 
Elsevier 所 拥有 的 关于 给 定 主题 的 全 部 信息 ,这 种 信息 跨越 了 相互 分 离 的 所 有 传 
统 学 科 和 刊物 的 边界 。 
当前 , 像 Elsevier 这 样 的 大 出 版 商 很 难 提供 这 样 的 横向 产品 。 由 Elsevier 出 版 的 
信息 产品 被 分 割 封闭 在 不 同 的 刊物 内 ,每 个 刊物 都 有 自己 的 一 套 索 引 系 统 ,每 套 
索引 系统 都 是 根据 不 同 的 物理 标准 、 语 法 标准 以 及 语义 标准 组 织 起 来 的 。 物 理 的 


甸 11 竟 互联 网 和 能 一 573 一 一 一 


和 语法 的 壁 又 是 可 以 解决 的 。Elsevier 已 经 把 许多 产品 的 内 容 转译 为 允许 跨 杂 
志 查 询 的 XML 格式 。 然 而 ,语义 的 问题 大 部 分 还 没有 解决 。 当 然 , 从 多 个 刊物 
中 搜索 包含 相同 关键 词 的 文章 是 可 能 的 ,但 不 太 可 能 提供 令 人 满意 的 结果 ,因为 
同一 领域 内 或 者 不 同 领域 间 普遍 存在 同音 词 .同义词 问题 。 我 们 需要 的 是 用 一 个 
相 容 的 概念 集合 为 所 有 刊物 建立 索引 ,并 据 此 搜索 各 个 刊物 的 方法 。 

根据 上 述 背 景 ,查阅 资料 ,撰写 论文 ,并 开发 解决 此 类 问题 的 原型 系统 。 

11.17 (思考 题 ) 奥 迪 的 数据 整合 。 上 面 的 问题 本 质 上 是 一 个 数据 整合 问题 。Elsevier 

试图 解决 这 一 问题 是 为 了 顾客 方便 。 但 是 ,在 各 个 公司 内 部 ,数据 整合 也 是 一 个 
巨大 的 问题 。 事实 上 , 它 被 普遍 认为 是 大 公司 信息 技术 预算 中 最 昂贵 的 开支 项 
目 。 如 奥迪 公司 这 样 规模 的 企业 (雇员 51 000 人 、 每 年 缴 税额 220 亿美 元 、 汽 车 
产量 700 000 辆 ) ,操作 数 千 个 数据 库 , 常 常 对 相同 的 信息 多 次 重复 存储 ,而 且 因 
为 数据 源 没有 相互 连接 而 时 有 遗漏 。 现 有 处 理 方式 依靠 昂贵 的 手工 代码 生成 和 
点 对 点 的 翻译 脚本 完成 数据 整合 。 
传统 的 中 间 件 (middleware) 固 然 能 改进 和 简化 整合 过 程 , 却 需 应 对 来 自 数据 整合 
的 根本 挑战 一 一 基于 预定 含义 ( 即 数据 语义 ) 的 信息 共享 。 
使 用 本 体 作 为 语义 数据 模型 可 以 将 各 不 相同 的 数据 源 合理 地 融合 为 单一 的 信息 
整体 。 通 过 为 数据 和 内 容 源 创建 本 体 ,以 及 添加 通用 的 领域 知识 ,整合 企业 内 各 
不 相同 的 数据 源 的 工作 就 可 以 在 不 干扰 已 有 应 用 软件 的 情况 下 进行 。 本 体 被 映 
射 到 数据 源 ( 域 .记录 文件、 文档 ) ,使 得 应 用 软件 可 以 通过 本 体 直 接 访问 数据 。 
设计 并 开发 解决 该 问题 的 原型 系统 。 

11.18 (思考 题 ) 人 寿 保险 公司 的 技能 寻 获 。 瑞 士 人 寿 保险 公司 在 欧洲 的 人 寿 保险 行业 
中 居于 领先 地 位 ,全 球 雇员 11 000 人 ,账面 保险 费 约 140 亿美 元 ,其 子 公司 、 分 支 
机 构 、 代 办 处 和 合作 伙伴 遍布 约 50 个 国家 。 

在 所 有 公司 中 ,关于 行业 惯例 的 知识 .个 人 能 力 和 雇员 的 技能 都 是 应 对 知识 密集 
型 任务 的 最 重要 的 资源 。 它 们 是 公司 成 功 凭借 的 真正 底蕴 。 建 立 一 个 可 以 电子 
化 访问 的 关于 人 的 能 力 、 经 验 和 关键 知识 领域 的 信息 库 是 建立 企业 知识 管理 的 主 
要 步骤 之 一 。 这 样 一 个 技能 信息 库 可 用 于 : 搜寻 拥有 特定 技能 的 人 员 、 揭 示 技 能 
差距 和 能 力 等 级 .指导 作为 职业 生涯 计划 一 部 分 的 培训 过 程 以 及 为 公司 的 知识 资 
本 建立 档案 。 

公司 有 如 此 巨大 的 国际 化 工作 人 员 群 体 ,分 布 在 地 理 和 文化 上 各 不 相同 的 地 区 ， 
使 得 建立 整个 公司 的 技能 信息 库 成 为 一 项 困难 的 任务 。 怎 样 列 出 数量 繁多 的 各 
种 技能 ?怎样 组 织 它 们 .使 得 对 它们 的 访问 可 以 跨越 地 理 和 文化 的 疆界 ? 怎样 保 
证 该 信息 库 经 常 更 新 ? 

根据 上 述 背 景 ,查阅 资料 ,撰写 论文 ,并 开发 解决 此 类 问题 的 原型 系统 。 

11.19 (思考 题 ) 在 线 学 习 。 万 维 网 正在 不 断 地 改变 着 人 类 活动 的 许多 方面 ,其 中 包括 人 
们 的 学 习 。 传 统 学 习 具 有 以 下 几 个 特点 : 四 由 教育 者 驱动 ; @ 线 性 获取 知 
识 ; @ 时 间 和 地 区 依赖 。 
结果 ,学 习 是 面向 大 部 分 参与 者 而 非 个 性 化 的 ,因而 并 不 适合 于 每 一 个 有 天 赋 的 
学 生 的 具体 情况 ,尽管 这 种 传统 学 习 过 程 效率 高 并 且 在 很 多 场合 是 有 效 的 。 互 联 
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网 的 出 现 为 全 新 教育 方式 的 实现 铺 平 了 一 条 道路 。 

人 们 已 经 可 以 在 高 等 教育 中 看 到 这 种 变化 。 大 学 正 逐 步 把 活动 重心 转移 到 为 学 

生 提 供 更 多 的 灵活 性 上 。 虚 拟 大 学 和 在 线 课程 只 是 这 些 活 动 中 的 一 小 部 分 ,教育 

灵活 性 和 新 的 教育 方式 同样 在 传统 的 校园 内 得 以 施行 ,虽然 这 些 学 校 仍 然 要 求学 

生 到 课堂 上 课 , 但 对 他 们 的 限制 减少 了 。 渐 渐 地 ,学 生 就 能 够 选择 并 且 决 定 上 课 

的 内 容 和 评估 规程 ,确定 学 习 的 进度 ,采用 最 适合 自己 的 学 习 方法 。 

我 们 同样 期 待 在 线 学 习 会 对 企业 员工 的 业务 素质 和 个 人 的 终生 学 习 活动 产生 更 

大 的 影响 。 提 高 企业 竞争 力 的 一 个 重要 机 制 是 提高 员工 的 技能 。 企 业 需 要 及 时 

的 、 满 足 其 特殊 需求 而 且 能 够 完美 地 融入 日 常 工作 方式 的 学 习 过 程 。 传 统 的 学 习 

方式 不 能 满足 这 些 需 要 ,而 在 线 学 习 很 有 希望 解决 这 个 问题 。 

与 传统 教育 不 同 ,在线 学 习 不 受 教师 的 驱动 ,学 生 能 够 以 一 种 非 预 定 的 顺序 获得 

学 习 资料 ,并 通过 选择 学 习 资 料 自己 编排 课程 。 要 想 实现 这 种 方式 ,必须 给 学 习 

资料 附加 额外 信息 ,以 支持 有 效 的 索引 和 检索 。 

元 数据 的 运用 是 解决 上 述 问题 的 一 种 自然 方式 ,并 且 长 期 被 图 书 管理 员 或 多 或 少 

地 使 用 。 在 在 线 学 习 界 (e-learning community) , 像 IEEE LOM 这 样 的 标准 已 经 

出 台 。 它 与 学 习 资 料 的 信息 相关 联 , 如 教育 和 教学 属性 ,访问 权限 和 使 用 条 件 ,以 

及 与 其 他 教育 资源 的 关系 等 。 虽然 这 些 标准 是 有 用 的 ,但 它们 面临 着 与 所 有 完全 

基于 元 数据 的 解决 方案 (XML 途径 ) 一 样 的 困扰 一 一 缺少 语义 。 结 果 , 组 合 来 自 

不 同 作者 的 资料 可 能 很 困难 ,对 检索 的 支持 可 能 不 是 最 佳 的 ,并 且 学 习 资源 的 检 

索 和 组 织 必须 人 工 完 成 ,而 不 是 个 性 化 地 自动 agent (personalized automated 

agent) 实 现 。 如 果 使 用 语义 网 技术 ,就 能 避免 这 些 问题 。 

语义 网 的 关键 思想 , 即 语义 共享 (本 体 ) 和 机 器 可 处 理 (machine-processable) 的 元 

数据 ,为 满足 在 线 学 习 的 需求 提供 一 条 有 和 希望 的 途径 , 它 能 支持 学 习 资 料 的 语义 

查询 和 概念 化 导航 ,并 具有 下 列 特点 。 

(1) 由 学 习 者 驱动 。 不 同 作 者 编著 的 学 习 资 料 能 够 与 公认 的 本 体 相 链接 。 学 习 
者 可 以 通过 语义 查询 设计 自己 的 个 性 化 课程 ,并 且 可 以 根据 实际 问题 的 上 下 
文 检 索 学 习 资料 。 

(2) 灵活 的 资料 获取 。 能 够 按照 学 习 者 的 兴趣 和 需要 以 他 们 希望 的 顺序 获得 知 
识 。 尽 管 在 一 定 条 件 下 语义 标注 仍然 会 设置 某 些 限制 ,但 非 线 性 获取 方式 在 
总 体 上 是 有 保证 的 。 

(3) 集成 性 。 语 义 网 能 够 为 各 个 机 构 的 商业 过 程 提 供 一 个 统一 的 平台 ,并 将 学 习 
活动 集成 到 这 些 过 程 中 。 这 个 解决 方案 或 许 对 商业 公司 来 说 极 具 价 值 。 

根据 上 述 背 景 ,查阅 资料 ,撰写 论文 ,并 开发 解决 此 类 问题 的 原型 系统 。 

(思考 题 ) 警 察 局 的 多 媒体 收藏 索引 。 在 诸如 伦敦 警察 局 和 国际 刑警 组 织 这 样 的 

警察 机 构 中 ,有 特殊 部 门 专职 负责 艺术 品 和 古玩 盗窃 的 案件 。 这 类 盗窃 案件 的 案 

犯 往往 难以 追踪 ,即便 成 功 追踪 并 追 回 被 盗 物 品 , 怎 样 物 归 原 主 也 是 一 个 难题 。 

虽然 现在 已 经 建立 了 被 盗 艺术 品 的 国际 数据 库 , 但 要 在 这 些 数 据 库 中 找到 特定 的 

物品 仍然 不 容易 ,因为 不 同 团体 常常 会 提供 不 同 的 描述 。 一 个 举报 盗窃 案 的 博物 

馆 也 许 会 把 一 个 物品 描述 为 “宋代 莲花 瓷 瓶 ,而 一 位 警官 在 报告 一 件 寻 获 的 物品 
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时 却 很 可 能 简单 地 输入 “12. 5 英寸 高 有 叶 状 装饰 的 浅 绿色 花瓶 >。 目前 ,需要 人 
类 专家 鉴别 失窃 花瓶 是 否 就 是 寻 获 的 花瓶 。 

解决 办 法 的 一 部 分 工作 是 开发 受 控 的 词汇 库 , 如 Getty Trust 的 《艺术 与 建筑 分 
类 辞典 )(AAT) ,或 Iconclass 分 类 辞典 ,把 它们 扩展 为 成 熟 的 本 体 , 开 发 能 够 使 
用 本 体 背 景 知识 根据 物理 外 观 描述 对 各 类 物品 进行 自动 鉴别 的 软件 ,并 解决 不 同 
团体 使 用 不 同 本 体 描述 相同 物品 时 出 现 的 本 体 映 射 问题 。 

根据 上 述 背 景 ,查阅 资料 ,撰写 论文 ,并 开发 解决 此 类 问题 的 原型 系统 。 

11.21 (思考 题 ) 康 富 的 在 线 采购 。 与 现今 所 有 汽车 生产 厂商 一 样 , 康 富 为 了 获得 各 种 汽 
车 零 配件 要 与 几 百 家 供 货 商 进行 交互 。 近 年 来 ,在 线 采购 已 被 认为 是 一 种 降低 成 
本 的 重要 潜在 手段 。 例 如 ,相互 发 送 合同 、 订 单 、 发 票 和 财务 转账 等 纸 面 过 程 可 以 
变更 为 在 软件 应 用 程序 之 间 进 行 数据 交换 的 电子 过 程 。 同 样 ,与 一 些 固定 供 货 商 
之 间 静 态 的 ,长 期 的 合作 关系 可 以 变更 为 开放 市 场 上 竞争 的 ,动态 的 、 短 期 的 合作 
关系 。 每 当 一 个 供 货 商 提出 了 更 好 的 价格 , 康 富 公司 希望 能 够 立刻 与 之 交易 ,而 
不 是 被 困 锁 在 与 男 一 个 供 货 商 之 间 的 长 期 协议 内 。 

这 种 在 线 采购 是 企业 对 企业 (B2B) 电 子 商 务 背 后 最 主要 的 动力 之 一 。B2B 电子 
商务 的 现 有 努力 严重 依赖 于 数据 格式 的 预先 标准 化 。 也 就 是 说 ,依赖 于 整个 行业 
事先 对 数据 格式 及 其 预期 语义 达成 一 致 。 像 Rosetta Net 这 样 的 组 织 是 专门 负 
责 这 种 标准 化 工作 的 。 从 Rosetta Net 的 网 站 上 可 以 看 到 : 

Rosetta Net 是 一 个 自 筹 资金 的 非 营利 组 织 。 它 是 一 个 为 信息 技术 、 电 子 元 件 、 半 
导体 制造 和 电信 等 产业 的 大 公司 创建 和 实施 全 行业 开放 电子 商务 过 程 标准 而 工 
作 的 协会 。 这 些 标准 形成 一 个 通用 的 电子 商务 语言 ,以 协调 全 球 供 应 链 中 合作 伙 
伴 之 间 的 过 程 。 

由 于 这 些 数 据 格式 是 用 XML 规定 的 , 单 从 文件 本 身 读 不 出 任何 语义 ,合作 伙伴 
必须 在 耗 时 而 且 昂 贵 的 标准 谈判 中 达成 协议 ,然后 通过 手工 编码 将 数据 格式 规定 
的 语义 写 入 代码 中 。 

一 个 更 有 吸引 力 的 途径 是 使 用 RDF Schema 和 OWL 这 样 的 格式 ,因为 它们 具有 
显 式 定义 的 形式 语义 。 这 将 使 产品 描述 “ 自 带 语义 ”, 从 而 开启 远 比 现行 方式 更 自 
由 的 在 线 B2B 采购 过 程 之 门 。 

根据 上 述 背 景 ,查阅 资料 ,撰写 论文 ,并 开发 解决 此 类 问题 的 原型 系统 。 

11.22 〈 思 考题 ) 数 码 设备 的 可 共用 性 。 近 年 来 ,日 常 环 境 中 数码 设备 经 历 了 爆炸 式 的 发 
展 一 一 PDA、 手 机 数码 相机 、 笔 记 本 电脑 公共 场所 的 无 线 访问 ,汽车 中 的 GPS 
设备 ,等 等 。 在 这 一 背景 下 ,对 这 些 设备 之 间 的 可 共用 性 的 需求 正在 变 得 越 来 越 
强烈 。 这 些 设备 需求 具有 遍布 各 地 和 无 线 通 信 的 特点 ,因而 需要 支持 自动 , 特 设 
配置 的 网 络 体系 结构 。 
真正 的 特 设 配置 网 络 的 一 项 关键 技术 是 服务 发 现 , 即 描述 .发布 和 找到 其 他 服务 
的 能 力 , 这 里 的 服务 包括 蜂窝 电话 .打印 机 、 传 感 器 等 各 种 设备 提供 的 功能 。 现 有 
各 种 设备 发 现 和 能 力 描述 机 制 (如 Sun 的 JINI、 微 软 的 UPnP) 基 于 特 设 表示 模 
式 , 而 且 严重 依赖 于 标准 化 (事先 确定 所 有 在 通信 或 讨论 中 可 能 涉及 的 东西 ) 。 

比 这 种 事先 标准 化 更 有 吸引 力 的 是 “即兴 可 共用 性 ,这 是 在 不曾 排练 过 的 ?条 件 
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下 的 可 共用 性 。 也 就 是 说 ,设备 的 设计 不 一 定 非 要 考虑 到 协作 ,可 以 在 不 同 的 时 
间 由 不 同 的 厂商 为 了 不 同 的 目的 生产 出 来 , 却 仍 然 能 够 互相 发 现 和 利用 对 方 的 优 
势 功 能 。“ 理 解 ? 其 他 设备 并 且 推 断 其 服务 或 功能 是 必要 的 ,因为 未 来 成 熟 的 无 所 
不 在 的 计算 场景 将 涉及 数 十 乃至 数 百 个 设备 ,对 这 样 的 场景 进行 事先 标准 化 是 极 
其 困难 的 。 

与 在 线 采购 的 场景 相似 ,为 了 实现 这 种 对 功能 “即兴 ”的 相互 理解 ,需要 借助 带 有 
标准 语义 的 本 体 。 

根据 上 述 背 景 ,查阅 资料 ,撰写 论文 ,并 开发 解决 此 类 问题 的 原型 系统 。 


附录 人 


人 工 智能 编程 语言 Python 


目前 常用 的 人 工 智能 程序 设计 语言 既 包 括 Prolog 等 专用 的 逻辑 编程 语 
言 , 也 包括 C++ 、Java 等 通用 型 编程 语言 ,本 附录 介绍 了 这 些 常 用 语言 的 特 
点 和 适用 范围 。 


A.1 人 工 智 能 编程 语言 概述 


人 工 智 能 是 一 个 很 广阔 的 领域 ,几乎 所 有 的 通用 型 编程 语言 都 可 以 用 于 
人 工 智 能 开发 ,但 在 开发 难度 和 开发 效率 上 会 有 优 劣 之 分 。 针 对 不 同 的 应 用 
需求 选择 合适 的 编程 语言 ,能够 为 开发 人 员 节 省 时 间 及 精力 。 

1. Python 

Python 语言 本 身 具 有 清晰 、 简 洁 的 语法 结构 ,更 贴近 自然 语言 ,是 人 工 
智能 领域 中 使 用 最 广泛 的 编程 语言 之 一 , 它 可 以 无 颖 地 与 各 种 数据 结构 和 常 
用 的 AI 算法 结合 使 用 。Python 之 所 以 适合 AI 项 目 , 也 基于 Python 拥有 很 
多 可 以 在 AI 中 使 用 的 库 , 如 NumPy 是 一 个 定义 了 数值 数组 和 和 矩阵 类 型 和 
它们 的 基本 运算 的 语言 扩展 ,SciPy 是 一 种 使 用 NumPy 做 高 等 数学 、 信 和 号 处 
理 、 优 化 统计 和 许多 其 他 科学 任务 的 语言 扩展 ,PyBrain 是 Python 的 一 个 
机 器 学 习 模块 , 它 的 目标 是 为 机 器 学 习 任 务 提供 灵活 、 易 应 、 强 大 的 机 器 学 习 
算法 。 另 外 ,Python 有 大 量 的 在 线 资源 和 成 熟 社区 ,所 以 学 习 曲 线 会 比较 
缓和 。 

2. Java 

Java 也 是 AI 项 目的 一 个 很 好 的 选择 。 它 是 一 种 面向 对 象 的 编程 语言 ， 
专注 于 提供 AI 项 目 上 所 需 的 所 有 高 级 功能 , 它 是 可 移植 的 ,并 且 提 供 了 内 置 
的 垃圾 回收 机 制 。 另 外 ,Java 社区 也 是 一 个 加 分 项 ,完善 丰富 的 社区 生态 可 
以 帮助 开发 人 员 随 时 查询 和 解决 遇 到 的 问题 。 

对 于 AI 项 目 来 说 ,算法 是 灵魂 ,无 论 是 搜索 算法 .自然 语言 处 理 算 法 ,还 
是 神经 网 络 ,Java 都 可 以 提供 一 种 简单 的 编码 算法 。 另 外 ,Java 的 扩展 性 也 
是 AI 项 目 必 备 的 功能 之 一 。 

3. LISP 

LISP 因 其 出 色 的 原型 设计 能 力 和 对 符号 表达 式 的 支持 在 AI 领域 占有 
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一 席 之 地 。 作 为 一 种 为 人 工 智 能 而 设计 的 语言 ,LISP 是 第 一 个 声明 式 函 数 式 程序 设计 语 
言 ,' 有 别 于 命令 式 过 程式 的 C、Fortran 和 面向 对 象 的 Java、C# 等 结构 化 程序 设计 语言 。 

LISP 语言 因 其 可 用 性 和 符号 结构 而 主要 用 于 机 器 学 习 /ILP (inductive logic 
programming ,归纳 逻辑 编程 ) 子 领域 。 著 名 的 AI 专家 彼得 。 诺 维 奇 (Peter Norvig) 在 其 
Artificial Intelligence: A Modern Approach 一 书 中 详细 解释 了 为 什么 LISP 是 AI 开发 
的 顶级 编程 语言 之 一 ca 。 

4. Prolog 

Prolog 与 LISP 在 可 用 性 方面 旋 鼓 相当 , 据 Prolog Programming or Artificial 
Intelligence 中 一 文 介绍 ,Prolog 是 一 种 逻辑 编程 语言 ,主要 是 对 一 些 基 本 机 制 进行 编程 ， 
对 于 AI 编程 十 分 有 效 , 如 它 提供 模式 匹配 .自动 回溯 和 基于 树 的 数据 结构 化 机 制 。 结 合 
这 些 机 制 可 以 为 AI 项 目 提供 一 个 灵活 的 框架 。 

Prolog55 广 泛 应 用 于 AI 的 专家 系统 ,特别 是 医疗 领域 。 

Ct 

C++ 是 最 快 的 计算 机 语言 , 它 特别 适用 于 对 时 间 敏 感 的 AI 编程 项 目 。C++ 能 够 提 
供 更 快 的 执行 时 间 和 响应 时 间 ( 这 就 是 为 什么 它 经 常用 于 搜索 引擎 和 游戏 )。 此 外 ,C++ 
允许 大 规模 的 使 用 算法 ,并 且 在 使 用 统计 AI 技术 方面 非常 高 效 。 另 一 个 重要 因素 是 由 
于 继承 和 数据 隐藏 ,在 开发 中 C++ 支持 重用 代码 ,因此 既 省 时 ,又 省 钱 。C++ 适用 于 机 器 
学 习 和 神经 网 络 。 

为 AI 项 目 选择 编程 语言 ,其 实 很 大 程度 上 都 取决 于 应 用 领域 ,对 编程 语言 的 选择 要 
从 大 局 人 手 , 不 能 只 考虑 部 分 功能 。 在 这 些 编程 语言 中 ,Python 因为 适用 于 大 多 数 AI 领 
域 ,所 以 渐 有 成 为 AI 编程 语言 之 首 的 趋势 ,而 LISP 和 Prolog 因 其 独特 的 功能 ,所 以 在 部 
分 AI 项 目 中 卓有成效 ,地 位 暂时 难以 撼动 。Java 和 C++ 的 自身 优势 将 在 AI 项 目 中 继续 
保持 。 

人 工 智 能 的 第 三 次 浪潮 是 科技 巨头 主导 的 面向 应 用 的 一 次 大 整合 ,如 “增强 智能 “ 群 
体 智 能 “ 认 知 计算 ”等 。 以 AlphaGo 为 代表 的 深度 学 习 方法 是 人 工 智 能 第 三 次 浪潮 的 重 
要 驱动 力 , 它 的 成 功 原因 通常 被 归结 于 三 点 : 大 数据 ,超级 计算 能 力 和 新 的 数学 方法 。 

从 业界 需求 看 ,在 著名 的 国外 招聘 网 站 indeed. com 搜索 机 器 学 习 和 数据 科学 相关 职 
位 对 各 种 编程 语言 的 需求 ,可 以 发 现在 人 工 智 能 的 机 器 学 习 和 数据 科学 等 子 领域 尚未 出 
现 一 枝 独 秀 的 情况 ,至 少 五 六 种 语言 呈现 出 百花 齐 放 的 态势 ,并 且 最 近 两 年 职位 需求 增长 
迅速 ,如 图 A-1 所 示 。 从 图 A-1 可 以 看 出 ,Python 处 于 领先 地 位 ,R、Java、C++ 系列 紧 随 
其 后 。 

从 开发 者 生态 看 ,著名 的 开发 者 问答 论坛 StackOverflow 将 Python 评 为 2017 年 开 
发 者 最 喜欢 的 语言 ,并 预测 未 来 两 年 内 Python 将 继续 保持 领先 优势 。StackOverflow 论 
坛 编程 语言 热度 趋势 如 图 A-2 所 示 。 

结合 院 校 编程 语言 教学 情况 看 ,Python 已 经 是 数据 分 析 和 AI 的 第 一 语言 ,网 络 攻防 
的 第 一 黑客 语言 ,正在 成 为 编程 人 门 教 学 的 第 一 语言 , 云 计 算 系 统管 理 的 第 一 语言 。 
Python 也 早 就 成 为 Web 开发 ,游戏 脚本 、 计 算 机 视觉 物 联网 管理 和 机 器 人 开发 的 主流 
语言 之 一 , 随 着 Python 用 户 可 以 预期 的 增长 , 它 还 有 机 会 在 多 个 领域 登 顶 。 
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= Python and ("machine leaming' or "data science"): 0.0361% 
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图 A-1 机 器 学 习 和 数据 科学 相关 职位 对 编程 语言 的 需求 
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图 A-2 StackOverflow 论坛 编程 语言 热度 趋势 
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A.2 Python 语言 优势 


Python 语言 的 以 下 特点 说 明了 Python 成 为 AI 领域 首选 编程 语言 的 原由 。 

(1) Python 程序 语法 精练 ,具有 很 好 的 可 读 性 ,接近 于 伪 代 码 。Python 致力 于 提高 
可 读 性 ,降低 复杂 性 ,便于 理解 和 交流 。 

(2) Python 程序 与 多 种 语言 保持 了 良好 的 互 操作 性 ,可 以 兼顾 开发 效率 与 执行 效 
率 。 首 先 以 高 级 语言 进行 整体 设计 开发 ,然后 将 最 影响 执行 效率 的 部 分 以 其 他 语言 (如 C 
语言 ) 重 写 。 人 们 也 把 Python 称 为 胶水 语言 ,让 人 能 够 很 容易 地 入 门 , 把 各 种 基本 程序 
元 件 拼装 在 一 起 ,协调 运作 。 

(3) Python 构建 了 最 好 的 AI 开发 生态 圈 。 真 正 使 Python 和 其 他 语言 区 分 开 的 是 
它们 的 框架 和 库 的 环境 ,Python 在 AI 领域 拥有 非常 成 熟 和 覆盖 广泛 的 软件 库 。 

(4) 开源 且 跨 平台 。Python 程序 与 平台 无 关 , 可 以 在 Windows 操作 系统 和 几乎 每 一 
个 Linux、UNIX 版 本 上 使 用 。 

所 以 ,Python 不 是 最 简单 的 语言 ,但 是 比较 简单 ,也 不 是 执行 速度 最 快 的 语言 ,但 是 
比较 快 ,达到 了 一 种 简单 与 效率 的 平衡 。 随 着 AI 产业 的 从 业 人 数 不 断 跃升 ,其 中 真正 的 
人 工 智能 科班 出 身 的 科学 家 ,甚至 计算 机 程序 设计 专业 人 员 的 比例 可 能 非常 小 ,更 多 的 
AI 技术 人 员 来 自 各 行 各 业 的 领域 工程 师 , 他 们 带 着 各 自 领域 中 的 行业 知识 和 数据 资源 涌 
入 Python 和 AI 大 潮 中 ,深刻 地 改变 整个 人 工 智能 产业 的 整体 格局 和 面貌 。 这 些 人 群 正 
是 Python 语言 的 目标 用 户 。 


A.3 Python 人 工 智 能 相关 库 


Github 上 前 20 名 Python 人 工 智 能 和 机 器 学 习 项 目 如 图 A-3 所 示 。 图 中 ,雪花 大 小 
与 贡献 者 的 数量 成 正比 。 雪 花形 状 适用 于 深度 学 习 项 目 , 圆 圈 适 用 于 其 他 项 目 。 

(1) TensorFlow 最 初 是 由 谷歌 机 器 智能 研究 机 构 的 Goole Brain Team 的 研究 人 员 
和 工程 师 开 发 的 。 该 系统 旨 在 促进 机 器 学 习 方 面 的 研究 ,并 使 其 快速 、 容 易 地 从 研究 原型 
过 渡 到 生产 系统 。 

(2) Scikit-learn 是 用 于 数据 挖掘 和 数据 分 析 的 简单 而 高 效 的 开源 工具 ,基于 
NumPy、SciPy 和 matplotlib 而 构建 ,并 以 商业 可 用 的 BSD 许可 证 发 布 ,允许 任何 人 在 各 
种 场景 中 使 用 。 

(3) Keras 是 一 种 高 级 神经 网 络 的 API, 用 Python 编写 ,能 够 在 TensorFlow、CNTK 
或 Theano 上 运行 。 

(4) PyTorch 可 用 于 生成 张 量 (Tensor) 和 动态 神经 网 络 (Dynamic neyral 
networks) ,并 能 在 Python 中 利用 GPU 进行 加 速 。 

(5) Theano 允许 定义 、 优 化 和 评估 涉及 多 维 数 数组 的 数学 表达 式 。 

(6) Gensim 是 一 个 免费 的 Python 库 , 具 有 可 扩展 的 统计 语义 ,用 于 分 析 语 义 结构 的 
纯 文本 文档 ,检索 语义 相似 的 文档 。 

(7) Caffe 是 一 个 深度 学 习 框架 ,注重 代码 的 表达 形式 、 运 算 速 度 以 及 模块 化 程度 。 
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图 A-3 Github 上 前 20 名 Python 人 工 智 能 和 机 器 学 习 项 目 


它 由 伯克利 视觉 和 学 习 中 心 (BVLC) 与 社区 贡献 者 开发 。 

(8) Chainer 是 一 个 基于 Python 的 深度 学 习 模 型 的 独立 开源 框架 。Chainer 提供 灵 
活 、 直 观 和 高 性 能 的 手段 实施 全 方位 的 深度 学 习 模 型 ,包括 最 新 的 模型 ,如 递归 神经 网 络 
和 变 分 自动 编码 器 。 

(9) Statsmodels 是 一 个 Python 模块 ,允许 用 户 探索 数据 ,估计 统计 模型 并 执行 统计 
测试 。 描 述 统 计 、 统 计 测试 .绘图 功能 和 结果 统计 的 广泛 列表 适用 于 不 同类 型 的 数据 和 估 
算 器 。 

(10) Shogun 是 机 器 学 习 工 具 箱 , 它 提供 了 广泛 的 统一 和 高 效 的 机 器 学 习 方法 。 该 
工具 箱 可 以 无 缝 地 组 合 多 个 数据 表示 、 算 法 类 和 通用 工具 。 

(11) Pylearn2 是 一 个 机 器 学 习 库 。 其 大 部 分 功能 都 建立 在 Theano 之 上 。 这 意味 着 
可 以 使 用 数学 表达 式 编 写 Pylearn2 插件 (如 新 模型 .算法 等 ),Theano 将 为 你 优化 和 稳定 
这 些 表 达 式 , 并 将 它们 编译 为 你 选择 的 后 端 (CPU 或 GPU ) 。 

(12) NuPIC 是 一 个 开源 项 目 , 它 基于 被 称 为 分 层 时 间 存储 器 (HTM) 的 新 大 脑 皮 层 
理论 。 部 分 HTM 理论 已 经 在 应 用 中 实施 、 测 试 和 使 用 ,而 HTM 理论 的 其 他 部 分 仍 在 开 
发 中 。 

(13) Neon 是 Nervana 基于 Python 的 深度 学 习 库 , 它 提供 易 用 性 ,同时 提供 最 高 的 
性 能 。 

(14) Nilearn 是 一 个 Python 模块 ,用 于 快速 简单 地 统计 学 习 神经 成 像 数 据 。 它 利用 
scikit-learn Python 工具 箱 进行 多 变量 统计 ,并 提供 预测 建 模 、 分 类 、 解 码 或 连接 分 析 等 
应 用 。 

(15) Orange3 是 适合 编程 新 手 和 领域 专家 的 开源 机 器 学 习 和 数据 可 视 化 工具 ,使 用 
大 型 工具 箱 和 交互 式 数据 分 析 工作 流程 。 
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(16) Pymec 是 一 个 Python 模块 ,实现 贝 叶 斯 统计 模型 和 拟 合算 法 ,包括 马尔 可 夫 链 
蒙特 卡 罗 (Markov chain Monte Carlo) 。 其 灵活 性 和 可 扩展 性 使 其 适用 大 量 问题 。 

(17) Deap 是 用 于 快速 原型 设计 和 测试 思想 的 新 型 演化 计算 框架 , 它 试图 使 算法 明 
确 , 数 据 结 构 透明 。 它 与 多 处 理 (Multiprocessing) 和 SCOOP 等 并 行 机 制 完美 协调 。 

(18) Annoy(Approximate nearest neighbor oh yeah) 是 一 个 C++ 库 , 它 使 用 Python 
绑 定 搜索 接近 给 定 查询 点 的 空间 点 。 它 还 创建 了 大 量 的 基于 只 读 文件 的 数据 结构 ,这 些 
数据 结构 被 映射 到 内 存 中 ,以 便 许多 进程 可 以 共享 相同 的 数据 。 

(19) PyBrain 是 Python 的 模块 化 机 器 学 习 库 。 其 目标 是 为 机 器 学 习 任务 提供 灵活 、 
易于 使 用 但 仍然 强大 的 算法 ,以 及 各 种 预定 义 环境 来 测试 和 比较 你 的 算法 。 

(20) Fuel 是 一 个 数据 管道 框架 , 它 为 你 的 机 器 学 习 模 型 提供 所 需 数据 。Fuel 被 用 
于 Blocks 和 Pylearn2 神经 网 络 库 。 


A.4 Python 语法 简介 


Python 支持 交互 式 编程 和 脚本 式 编程 。 交 互 式 编程 不 需要 创建 脚本 文件 ,是 通过 
Python 解释 器 的 交互 模式 来 编写 代码 。 脚 本 式 编程 通过 脚本 参数 调用 解释 器 开始 执行 
脚本 ,直到 脚本 执行 完毕 。 当 脚本 执行 完成 后 ,解释 器 不 再 有 效 。 

1. 基本 语法 

Python 的 语法 比较 简单 ,采用 缩 进 方式 ,以 # 开头 的 语句 是 注释 。 


#print absolute value of an integer: 

a=100 

if a> =0s 

Print (a) 
else: 
print (-a) 

2. 数据 类 型 

Python 支持 以 下 数据 类 型 。 

1) 整数 

Python 可 以 处 理 任 意 大 小 的 整数 ,当然 包括 负 整 数 ,在 程序 中 的 表示 方法 和 数学 上 
的 写法 一 模 一 样 ,如 1,100, 一 8080.0 等 。 

2) 浮 点 数 

浮 点 数 也 就 是 小 数 ,之 所 以 称 为 浮 点 数 ,是 因为 按照 科学 记 数 法 表示 时 ,一 个 浮 点 数 
的 小 数 点 位 置 是 可 变 的 ,例如 ,1.23X10? 和 12.3X10s 是 完全 相等 的 。 

整数 和 学 点 数 在 计算 机 内 部 存储 的 方式 是 不 同 的 ,整数 运算 永远 是 精确 的 ,而 浮 点 数 
运算 则 可 能 会 有 四 舍 五 人 的 误差 。 

3) 字符 串 

字符 串 是 以 单 引号 或 双 引 号 " 括 起 来 的 任意 文本 ,如 'abc"xyz" 等 。 

4) 布尔 值 

布尔 值 和 布尔 代数 的 表示 完全 一 致 .一 个 布尔 值 只 有 True、False 两 种 值 。 
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5) 空 值 

空 值 是 Python 里 一 个 特殊 的 值 ,用 None 表示 。 

Python 支持 多 种 数据 类 型 ,在 计算 机 内 部 ,可 以 把 任何 数据 都 看 成 一 个 “对 象 ”, 而 变 
量 就 是 在 程序 中 用 来 指向 这 些 数据 对 象 的 ,对 变量 赋值 就 是 把 数据 和 变量 关联 起 来 。 

对 变量 赋值 x==y 是 把 变量 x 指向 真正 的 对 象 , 该 对 象 是 变量 y 所 指向 的 ,随后 对 变 
量 y 的 赋值 不 影响 变量 x 的 指向 。 

3. 数据 容器 

Python 有 一 系列 的 数据 容器 ,可 以 将 各 种 数据 元 素 组 成 一 个 集合 。 

1) list 

Python 内 置 的 一 种 数据 类 型 是 列表 (list) 。list 是 一 种 有 序 的 集合 ,可 以 随时 添加 和 
删除 其 中 的 元 素 。 

2) tuple 

另 一 种 有 序列 表 叫 元 组 (tuple) 。tuple 和 list 非常 类 似 , 但 是 tuple 一 旦 初始 化 ,就 不 
能 修改 。 

3) dict 

Python 内 置 了 字典 : dict 的 支持 ,dict 的 全 称 为 dictionary, 在 其 他 语言 中 也 称 之 为 
map, 使 用 键 - 值 (key-value) 存 储 , 具 有 极 快 的 查找 速度 。 

4) set 

set 和 dict 类 似 ,也 是 一 组 Key 的 集合 ,但 不 存储 value。 由 于 Key 不 能 重复 ,所 以 在 
set 中 没有 重复 的 Key。 

4. 控制 结构 

Python 支持 顺序 ,分支 .循环 控制 结构 的 结构 化 程序 设计 。 

Python 的 循环 有 两 种 : 一 种 是 for…in 循环 ,依次 把 list 或 tuple 中 的 每 个 元 素 迭 代 
出 来 ,看 例子 : 


names = ['Michael', 'Bob', 'Tracy'] 





for name in names: 


Print (name) 
执行 这 段 代码 ,会 依次 打印 names 的 每 一 个 元 素 : 
Michael 


Bob 
Tracy 


第 二 种 循环 是 while 循环 ,只 要 条 件 满足 ,就 不 断 循环 ,条 件 不 满足 时 退出 循环 。 例 
如 ,要 计算 100 以 内 所 有 奇数 之 和 ,可 以 用 while 循环 实现 。 


sum=0 

县 二 99 

whilen> 0: 
Sum 一 Sum 十 D 


生 二 鸡 一 全 
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Print (sum) 
在 循环 内 部 变量 n 不 断 自 减 ,直到 变 为 一 1 时 不 再 满足 while 条 件 , 则 循环 退出 。 


5. 函数 
基本 上 所 有 的 高 级 语言 都 支持 函数 ,Python 也 不 例外 。Python 不 但 能 非常 灵活 地 


定义 函数 ,而 且 本 身 内 置 了 很 多 有 用 的 函数 ,可 以 直接 调用 。 


数 。 


要 调用 一 个 函数 ,需要 知道 函数 的 名 称 和 参数 ,如 求 绝对 值 的 函数 abs 只 有 一 个 参 
可 以 直接 从 Python 的 官方 网 站 查看 文档 : 

http://docs. python. org/3/library/functions. html# abs 

也 可 以 在 交互 式 命令 行 通过 help(abs) 查 看 abs 函数 的 帮助 信息 。 

调用 abs 函数 : 


>>>abs (100) 
100 

>>>abs (-20) 
20 

>>>abs (12.34) 
12.34 


6. 对 象 
面向 对 象 编程 (Object Oriented Programming,OOP) 是 一 种 程序 设计 思想 。OOP 把 


对 象 作为 程序 的 基本 单元 ,一 个 对 象 包含 了 数据 和 操作 数据 的 函数 。 


在 Python 中 ,所 有 数据 类 型 都 可 以 视 为 对 象 ,当然 也 可 以 自 定义 对 象 。 自 定义 的 对 


象 数 据 类 型 就 是 面向 对 象 中 的 类 (class) 的 概念 。 


本 附录 参考 了 阿里 云云 栖 社 区 、github .indeed. com、StackOverflaw 以 及 雇 雪 峰 


Python 教程 网 站 的 内 容 与 数据 。 


附录 愉 
手写 体 识别 案例 


来 源 于 谷歌 的 TensorFlow 是 目前 Python 编程 领域 最 热门 的 深度 学 习 
框架 。Google 不 仅 是 大 数据 和 云 计 算 的 领导 者 ,在 机 器 学 习 和 深度 学 习 上 
也 有 很 好 的 实践 和 积累 ,在 2015 年 年 底 开源 了 内 部 使 用 的 深度 学 习 框 架 
TensorFlow。 

与 Caffe、Theano、Torch、MXNet 等 框架 相 比 ,TensorFlow 在 Github 上 
Fork 数 和 Star 数 都 是 最 多 的 ,而 且 在 图 形 分 类 、 音 频 处 理 \ 推 荐 系统 和 自然 
语言 处 理 等 场景 下 都 有 丰富 的 应 用 。 最 近 流 行 的 Keras 框架 底层 默认 使 用 
TensorFlow, 著 名 的 斯 坦 福 CS231n 课程 使 用 TensorFlow 作为 授课 和 作业 
的 编程 语言 ,国内 外 多 本 TensorFlow 书籍 已 经 在 筹备 或 者 发 售 中 ,AlphaGo 
开发 团队 Deepmind 也 计划 将 神经 网 络 应 用 迁移 到 TensorFlow 中 ,这 无 不 
印证 了 TensorFlow 在 业界 的 流行 程度 。 

TensorFlow 的 流行 让 深度 学 习 门 槛 变 得 越 来 越 低 ,只 要 有 Python 和 机 
器 学 习 基 础 ,入 门 和 使 用 神经 网 络 模型 就 会 变 得 非常 简单 。TensorFlow 支 
持 Python 和 C++ 两 种 编程 语言 ,再 复杂 的 多 层 神 经 网 络 模型 都 可 以 用 
Python 实现 ,如 果 业 务 使 用 其 他 编程 也 不 用 担心 ,使 用 跨 语言 的 gRPC 或 者 
HTTP 服务 也 可 以 访问 使 用 TensorFlow 训练 好 的 智能 模型 。 

那 使 用 Python 如 何 编写 TensorFlow 应 用 呢 ? 从 入 门 到 应 用 究竟 有 多 
难 呢 ? 

下 面 介绍 一 个 神经 网 络 中 的 经 典 示 例 一 一 MNIST 手写 体 识别 。 这 个 任 
务 相 当 于 是 机 器 学 习 中 的 HelloWorld 程序 。 本 节 以 TensorFlow 源码 中 自 
带 的 手写 数字 识别 Example 为 例 , 引 出 TensorFlow 中 的 几 个 主要 概念 ,并 
结合 Example 源码 一 步 步 分 析 该 模型 的 实现 过 程 。 

什么 是 TensorFlow? 这 里 引入 TensorFlow 中 文 社区 首页 中 的 两 段 
描述 : 

TensorFlowIY 是 一 个 基于 数据 流 图 (data flow graphs) 用 于 数值 计算 的 
开源 软件 库 。 结 点 (nodes) 在 图 中 表示 数学 操作 ,图 中 的 边 (edges) 则 表示 在 
结 点 间 相 互联 系 的 多 维 数据 数组 , 即 张 量 (tensor)。 它 灵活 的 架构 让 你 可 以 
在 多 种 平台 上 展开 计算 ,例如 ,台式 计算 机 中 的 一 个 或 多 个 CPU( 或 GPU)、 
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服务 器 .移动 设备 等 。TensorFlow 最 初 由 Google 大 脑 小 组 (隶属 于 Google 机 器 智能 研 
究 机 构 ) 的 研究 员 和 工程 师 们 开发 ,用 于 机 器 学 习 和 深度 神经 网 络 方面 的 研究 ,但 这 个 系 
统 的 通用 性 使 其 也 可 广泛 用 于 其 他 计算 领域 。 

数据 流 图 用 * 结 点 "和 "* 边 ”的 有 向 图 描述 数学 计算 .“ 结 点 ”一 般 用 来 表示 施加 的 数 
学 操作 ,但 也 可 以 表示 数据 输入 (feed in) 的 起 点 /输出 (push out) 的 终点 ,或 者 是 读 取 / 写 
入 持久 变量 (persistent variable) 的 终点 。“ 边 ”表示 “ 结 点 ”之 间 的 输入 /输出 关系 。 这 些 
数据 * 边 ”可 以 输 运 “规模 可 动态 调整 的 多 维 数据 数组 , 即 * 张 量 ”。 张 量 从 图 中 流 过 的 直 
观 图 像 是 这 个 工具 取 名 为 TensorFlow 的 原因 。 一 旦 输入 端的 所 有 张 量 都 准备 好 了 , 结 
点 将 被 分 配 到 各 种 计算 设备 异步 并 行 地 执行 运算 。 





B. 1 MNIST 数据 集 


MNIST 是 一 个 简单 的 图 片 数据 集 ( 数 据 集 下 载 地 址 http://yann. lecun. com/exdb/ 
minist/) ,包含 了 大 量 的 数字 手写 体 图 片 。MNIST 数据 集 是 含 
































标注 信息 的 。 图 B-1 为 代表 5, 0, 4 和 1 的 图 片 示例 。 3 O L / 
由 于 MNIST 数据 集 是 TensorFlow 的 示例 数据 ,所 以 不 图 B-1 代表 5,0,4 和 1 
必 下 载 。 只 需要 下 面 两 行 代码 , 即 可 实现 数据 集 的 读 取 工作 。 的 图 片 示 例 


from tensorflow.examples.tutorials.mist import input data 
mmist =input data.read data sets ("MNIST data/", one hot=True) 


MNIST 数据 集 一 共 包 含 3 个 部 分 : 训练 数据 集 (55 000 份 ,mnist. train) ,测试 数据 
集 (10 000 份 ,mnist. test) 和 验证 数据 集 (5000 份 ,mnist. validation)。 一 般 来 说 ,训练 数 
据 集 用 来 训练 模型 ;验证 数据 集 可 以 检验 训练 出 来 的 模型 的 正确 性 和 是 否 过 拟 合 ;测试 数 
据 集 是 不 可 见 的 (相当 于 一 个 黑 盒 ) ,但 我 们 最 终 的 目的 是 使 得 训练 出 来 的 模型 在 测试 数 
据 集 上 的 效果 (这 里 是 准确 性 ) 达 到 最 佳 。 

MNIST 中 的 一 个 数据 样本 包含 两 块 : 手写 体 图 片 和 对 应 的 label。 这 里 我 们 用 xs 和 
ys 分 别 代表 图 片 和 对 应 的 label, 训 练 数 据 集 和 测试 数据 集 都 有 xs 和 ys, 我们 使 用 
mnist, train. images 和 mnist. train. labels 表示 训练 数据 集中 图 片 数据 和 对 应 的 label 
数据 。 

一 张 图 片 可 以 用 28X28 的 像素 点 矩阵 表示 ,也 可 以 用 一 个 同 大 小 的 二 维 矩 阵 表 示 ， 
如 图 B-2 所 示 。 

但 是 ,这 里 我 们 可 以 先 简单 地 使 用 一 个 长 度 为 28X28 二 784 的 一 维 数组 表示 图 像 , 因 
为 下 面 仅 使 用 softmax 回归 对 图 片 进行 识别 分 类 (尽管 这 样 做 会 损失 图 片 的 二 维 空间 信 
息 , 所 以 实际 上 最 好 的 计算 机 视觉 算法 是 会 利用 图 片 的 二 维 信息 的 ) 。 

所 以 ,MNIST 的 训练 数据 集 可 以 视 为 一 个 形状 为 55000X784 位 的 tensor, 也 就 是 一 
个 多 维 数组 ,第 一 维 表示 图 片 的 索引 ,第 二 维 表示 图 片 中 像素 的 索引 (tensor 中 的 像素 值 
在 0 一 1)。 训 练 数据 集 如 图 B-3 所 示 。 

MNIST 中 的 数字 手写 体 图 片 的 label 值 在 1 一 9 之 间 , 是 图 片 表示 的 真实 数字 。 这 里 
用 One-hot vector 表述 label 值 ,vector 的 长 度 为 label 值 的 数目 ,vector 中 有 且 只 有 一 位 
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oo0 00 0 0 oo oo 0 0 0 
0 0 00 0 0 0 0 0 0 0 oo 
o00000 国 国 。 °。 +。 oo 
oooo 和 可 国 。 oo。 oo 0 
ooooo 本 国 。 oo。 oo 
ooooo 加 国 国 。o。 oo 
ooooo 0 图 国 。o。 oo 
ooooo oo 故国 。 °。°。。，。 
ooooo 0 国 加 。。。。。o 
oooooo 加 国 。。。。o 
ooooo 国 国 局 。。。 
o00000 0 圆 国 加 0。 。%o% " 
oo0 00 0 0 0 0 0 0 0 0 0 
0 0 90900 0 0 0 0 0 0 0 0 0 


图 B-2 一 张 图 片 用 28X28 的 像素 点 矩阵 表示 


784 


mnist.train.xs 


55000 


图 B-3 训练 数据 集 


为 1, 其 他 为 0。 为 了 方便 ,我 们 表示 某 个 数字 时 在 vector 中 对 应 的 索引 位 置 设置 1 ,其 他 
位 置 元 素 为 0。 例 如 ,用 [0,0,0,1,0,0,0,0,0,0] 表 示 3。 所 以 ,mnist, train. labels 是 一 个 
55000X10 的 二 维 数组 。 训 练 数据 集 上 的 标注 如 图 B-4 所 示 。 


mnist.train.ys 



































55000 


图 B-4 训练 数据 集 上 的 标注 


以 上 是 MNIST 数据 集 的 描述 及 TensorFlow 中 的 表示 。 下 面 介 绍 Softmax 回归 


B.2 Softmax 回归 模型 


数字 手写 体 图 片 的 识别 实际 上 可 以 转换 成 一 个 概率 问题 ,如 果 知 道 一 张 图 片 表 示 9 
的 概率 为 80% ,而 剩 下 的 20% 概 率 分 布 在 8,6 和 其 他 数字 上 ,那么 从 概率 的 角度 上 ,可 以 


大 致 推断 该 图 片 表示 的 是 9。 


Softmax 回归 (regression) 是 一 个 简单 的 模型 ,很 适合 用 来 处 理 得 到 一 个 待 分 类 对 象 
在 多 个 类 别 上 的 概率 分 布 。 所 以 ,这 个 模型 通常 是 很 多 高 级 模型 的 最 后 一 步 。 
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Softmax 回归 大 致 分 为 两 步 。 

步骤 1: 将 输入 证 据 累 加 到 某 一 类 中 。 

步骤 2: 将 证 据 转换 成 概率 。 

为 了 利用 图 片 中 各 个 像素 点 的 信息 ,我 们 将 图 片 中 的 各 个 像素 点 的 值 与 一 定 的 权 值 
相 乘 并 累加 , 权 值 的 正 负 是 有 的 ,如 果 是 正 的 ,那么 表示 对 应 像素 值 (不 为 0) 对 表示 
该 数字 类 别 是 正面 的 ;否则 ,对 应 像素 值 ( 不 为 0) 对 表示 该 数字 类 别 起 负面 作用 。 图 B-5 
是 一 个 直观 的 例子 ,图 中 像 表示 影响 的 大 小 ( 越 亮 绝对 值 越 大) ,图 B-5(a) 表 
示 正 值 分 布 (明亮 区 域 的 形状 趋向 于 数字 形状 ) ,B-5(b) 表 示 负 值 分 布 。 


图 四 团圆 四 

» ,EE 
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(a) 正 值 分 布 


了 
0 1 2 3 4 
5 6 7 8 9 


(b) 负 值 分 布 
图 B-5 像素 点 对 数字 类 别 的 权重 















我 们 也 需要 加 入 一 个 额外 的 偏 置 量 (bias) ,因为 输入 往往 会 带 有 一 些 无 关 的 干扰 量 。 
因此 ,对 于 给 定 的 输入 图 片 zx, 它 代 表 的 是 数字 i 的 证 据 可 以 表示 为 
evidencei = Wi +b 

其 中 ,Wi 代表 权重 ;6b; 代表 数字 i 类 的 偏 置 量 ; 代表 给 定 图 片 z 的 像素 索引 用 于 像 
素 求 和 。 然 后 用 softmax 函数 可 以 把 这 些 证 据 转 换 成 概率 y。 
y= softmax(evidence) 

这 里 的 softmax 可 以 看 成 是 一 个 激励 (activation) 函数 或 者 链接 (ink) 函 数 ,把 我 们 
定义 的 线性 函数 的 输出 转换 成 我 们 想 要 的 格式 ,也 就 是 关于 10 个 数字 类 的 概率 分 布 。 因 
此 ,给 定 一 张 图 片 , 它 对 于 每 一 个 数字 的 吻合 度 可 以 被 softmax 函数 转换 成 为 一 个 概率 
值 。softmax 函数 可 以 定义 为 


softmax(x) = normalize(exp(x)) 


展开 等 式 右 边 的 子 式 , 可 以 得 到 








认 录 BB 手写 傣 次 列 生 向 一 589 


exp(CZi) 
exp(zi) 

但 是 ,更 多 的 时 候 是 把 softmax 模型 函数 定义 为 前 一 种 形式 : 把 输入 值 当成 寡 指 数 
求 值 ,再 正则 化 这 些 结果 值 。 这 个 宕 运算 表示 ,更 大 的 证 据 对 应 更 大 的 假设 模型 
Chypothesis) 里 的 乘 数 权重 值 。 反 之 ,拥有 更 少 的 证 据 意 味 着 在 假设 模型 里 拥有 更 小 的 
乘 数 系数 。 假 设 模型 里 的 权 值 不 可 以 是 0 值 或 者 负 值 。Softmax 会 正则 化 这 些 权重 值 ， 
使 它们 的 总 和 等 于 1, 以 此 构造 一 个 有 效 的 概率 分 布 。 

softmax 回归 模型 可 以 用 图 B-6 解释 。 对 于 输入 的 zi ,zo ,zs 加 权 求 和 ,再 分 别 加 上 
一 个 偏 置 量 ,最 后 再 输入 到 softmax 函数 中 。 


softmax(z); 一 
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图 B-6 ”softmax 函数 的 计算 过 程 


如 果 将 这 个 过 程 公式 化 ,将 得 到 


J1 





Waiz1 + W222 W233 bs 
ys Waizit Wa,szz t+ Waszs + bs 
也 可 以 用 向 量 表示 这 个 计算 过 程 : 用 和 矩阵 乘法 和 向 量 相 加 。 这 有 助 于 提高 计算 





yz: |= softmax 
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yi Wi Wi Wi,s 1 bi 
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进一步 ,可 以 写成 更 加 紧凑 的 方式 : 
y= softmax(Wz +b) 


B.3 Softmax 回归 的 程序 实现 


为 了 用 Python 实现 高 效 的 数值 计算 ,我们 通常 会 使 用 函数 库 , 如 NumPy, 会 把 类 似 
和 矩阵 乘法 这 样 的 复杂 运算 使 用 其 他 外 部 语言 实现 。 但 从 外 部 计算 切换 回 Python 的 每 一 
个 操作 仍然 是 一 个 很 大 的 开销 。 如 果 用 GPU 进行 外 部 计算 ,这 样 的 开销 会 更 大 。 用 分 
布 式 的 计算 方式 也 会 花费 更 多 的 资源 用 来 传输 数据 。 

TensorFlow 也 把 复杂 的 计算 放 在 Python 之 外 完成 ,但 是 为 了 避免 前 面 说 的 那些 开 
销 , 它 做 了 进一步 完善 。TensorFlow 不 单独 地 运行 单一 的 复杂 计算 ,而 是 让 我 们 可 以 先 
用 图 描述 一 系列 可 交互 的 计算 操作 ,然后 全 部 一 起 在 Python 之 外 运行 。( 这 样 类 似 的 运 
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行 方式 可 以 在 不 少 的 机 器 学 习 库 中 看 到 。) 

使 用 TensorFlow 之 前 ,首先 导入 它 : 

import tensorflow as tf 

利用 一 些 符 号 变量 描述 交互 计算 的 过 程 ,创建 如 下 。 

x =tf.placeholder (tf.float32, [None, 784]) 

工 不 是 一 个 特定 的 值 , 而 是 一 个 占 位 符 (Cplaceholder) ,我 们 在 TensorFlow 运行 计算 
时 输入 这 个 值 。 我 们 希望 能 够 输入 任意 数量 的 MNIST 图 像 , 每 一 张 图 展 平成 784 维 的 
向 量 。 我 们 用 二 维 的 浮 点 数 张 量 表示 这 些 图 ,这 个 张 量 的 形状 是 LNone,784]( 这 里 的 
None 表示 此 张 量 的 第 一 个 维度 可 以 是 任何 长 度 ) 。 

使 用 Variable( 变 量 ) 表 示 模 型 中 的 权 值 和 偏 置 ,这 些 参数 是 可 变 的 。 具 体 如 下 。 


W=tf.Variable (tf.zeros([784, 10])) 
b =tf.Variable (tf.zeros([10])) 


这 里 的 W 和 2 均 被 初始 化 为 0 值 矩 阵 。W 的 维 数 为 784X10, 是 因为 我 们 需要 将 一 
个 784 维 的 像素 值 经 过 相应 的 权 值 之 乘 转换 为 10 个 类 别 上 的 证 据 值 ;6 是 十 个 类 别 上 累 
加 的 偏 置 值 。 

实现 softmax 回归 模型 仅 需要 如 下 代码 : 

Y=tf.nn.softmax (tf.matmul (x, W) +b) 


其 中 ,matmul 函数 实现 了 x 和 W 的 乘积 ,这 里 的 x 为 二 维和 矩阵 ,所 以 放 在 前 面 。 可 
以 看 出 ,在 TensorFlow 中 实现 softmax 回归 模型 很 简单 。 


B.4 模型 的 训练 


在 机 器 学 习 中 ,通常 需要 选择 一 个 代价 函数 (或 者 损失 函数 ) ,指示 训练 模型 的 好 坏 。 
这 里 使 用 交叉 烂 函数 (cross-entropy) 作 为 代价 函数 ,交叉 炳 是 一 个 源 于 信息 论 中 信息 压 
缩 领域 的 概念 ,但 是 现在 已 经 应 用 在 多 个 领域 。 它 的 定义 如 下 。 


Hy(y) 一 一 > y'ilog(Cv) 
y 是 我 们 预测 的 概率 分 布 ;y 是 实际 的 分 布 (我 们 输入 的 one-hot vector) 。 比 较 粗 糙 
的 理解 是 ,交叉 焙 用 来 衡量 我 们 的 预测 用 于 描述 真相 的 低 效 性 。 
为 了 实现 交叉 炉 函数 ,需要 先 设置 一 个 占 位 符 在 存放 图 片 的 正确 label 值 ， 
y_ =tf.placeholder (tf.float32, [None, 10]) 
然后 得 到 交叉 灶 , 即 
— 2D) ylog(y) 
计算 交叉 灶 : 


cross_entropy =-tf.reduce sum(y * tf.log(y)) 
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注意 ,以 上 的 交叉 炉 不 局 限于 一 张 图 片 , 而 是 整个 可 用 的 数据 集 。 

接 下 来 以 代价 函数 最 小 化 为 目标 训练 模型 ,以 得 到 相应 的 参数 值 ( 即 权 值 和 偏 置 ) 。 
TensorFlow 知道 你 的 计算 目标 , 它 会 自动 利用 反 向 传播 算法 得 到 相应 的 参数 调整 ,并 满 
足 代 价 函 数 最 小 化 的 要 求 。 然 后 ,可 以 选择 一 个 优化 算法 决定 如 何 最 小 化 代价 函数 。 具 
体 代 码 如 下 : 


train step =tf.train.GradientDescentOptimizer (0.01) .minimize (cross_entropy) 


这 里 使 用 了 一 个 学 习 率 为 0.01 的 梯度 下 降 算法 来 最 小 化 代价 函数 。 梯 度 下 降 是 一 
个 简单 的 计算 方式 ,即使 得 变量 值 朝 着 减 小 代价 函数 值 的 方向 变化 。TensorFlow 也 提供 
了 许多 其 他 的 优化 算法 , 仅 需 要 一 行 代码 即 可 实现 调用 。 

TensorFlow 提供 了 以 上 简单 抽象 的 函数 调用 功能 ,你 不 需要 关心 其 底层 实现 ,可 以 
更 加 专心 于 整个 计算 流程 。 在 模型 训练 之 前 ,还 需要 对 所 有 的 参数 进行 初始 化 。 





init =tf.initialize all variables() 
可 以 在 一 个 Session 里 面 运 行 模型 ,并 且 进 行 初始 化 。 


sess =tf.Session() 


sess.run(init) 
接 下 来 进行 模型 的 训练 。 


for i in range (1000): 
batch xs, batch ys =mist.train.next batch(100) 
sess.run(train step, feed dict= {x: batch xs，Y_: batch ys}) 


在 每 一 次 的 循环 中 ,我 们 都 取 训 练 数据 中 的 100 个 随机 数据 ,这 种 操作 称 为 批 处 理 
(batch)。 然 后 ,每 次 运行 train_step 时 ,将 之 前 选择 的 数据 填充 至 所 设置 的 占 位 符 中 , 作 
为 模型 的 输入 。 

以 上 过 程 称 为 随机 梯度 下 降 ,这 里 使 用 它 是 非常 合适 的 。 因 为 它 既 能 保证 运行 效率 ， 
也 能 一 定 程度 上 保证 程序 运行 的 正确 性 (理论 上 ,我 们 应 该 在 每 一 次 循环 过 程 中 利用 所 有 
的 训练 数据 得 到 正确 的 梯度 下 降 方向 ,但 这 样 将 非常 耗 时 ) 。 


B.5 模型 的 评价 


怎样 评价 训练 出 来 的 模型 ? 显然 ,可 以 用 图 片 预测 类 别 的 准确 率 。 

首先 ,利用 tf. argmax() 函 数 得 到 预测 和 实际 的 图 片 label 值 ,再 用 一 个 tf. equal() 函 
数 判断 预测 值 和 真实 值 是 否 一 致 。 代 码 如 下 。 

correct prediction =tf.equal (tf.argmax (y,1), tf.argmax(y ,1)) 

correct_prediction 是 一 个 布尔 值 的 列表 ,如 [True，False，True,， True]。 可 以 使 用 
tf. cast() 函 数 将 其 转换 为 [1, 0, 1, 1] ,以 方便 准确 率 的 计算 (以 上 的 准确 率 为 0. 75) 。 


accuracy =tf.reduce mean (tf-cast (correct prediction, "float")) 
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最 后 ,获取 模型 在 测试 集 上 的 准确 率 , 代 码 如 下 。 
print (sess.run (accuracy，feed dict= {x: mist.test.images, y : mist.test.labels})) 


Softmax 回归 模型 由 于 模型 较 简 单 , 所 以 在 测试 集 上 的 准确 率 在 91% 左 右 , 这 个 结果 
并 不 算 太 好 。 通 过 一 些 简 单 的 优化 ,准确 率 可 以 达到 97%, 目 前 最 好 模型 的 准确 率 为 
99.7%。 


B.6 完整 代码 及 运行 结果 


利用 Softmax 模型 实现 手写 体 识别 的 完整 代码 如 下 。 


import tensorflow as tf 
from tensorflow.examples.tutorials .mist import input data 


mist =input data.read data sets ("MNIST data/", one hot=True) 
Print ("Download Done!") 


x=tf.placeholder (tf.float32, [None, 784]) 


#paras 
W=tf.Variable (tf.zeros ([784, 10])) 
b=tf.Variable (tf.zeros ([10])) 


y=tf.nn.softmax (tf.matmul (x, W) +b) 
Y_ =tf.placeholder (tf.float32, [None, 10]) 


#10ss func 


Cross entropy =-tf.reduce sum(ly * tf.log(y)) 
train step =tf.train.GradientDescentOptimizer (0.01) .minimize (cross_entropy) 


#init 


init =tf.initialize all variables() 


sess =tf.Session() 


sess.run(init) 


#train 

for i in range (1000) : 
batch xs, batch ys =mmnist.train.next batch (100) 
sess.run(train step, feed dict= {x: batch xs, y : batch ys}) 


correct prediction =tf.equal (tf.arg max(y, 1), tf.arg max(y , 1)) 
accuracy =tf.reduce mean(tf.cast (correct prediction, "float")) 


府 录 曲 手写 休 识 刚 菜 例 


print ("Accuarcy on Test- dataset: " 





,sess.run(accuracy, feed dict= {x: mnist.test.images, 
_: mist.test.labels})) 


运行 结果 如 图 B-7 所 示 。 


tudy/MNIST_ 





B-7 运行 结果 


本 附录 参考 了 Tensorflow 中 文 社区 以 及 Tensorflow 在 线 文 档 的 内 容 
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